据IT之家报道,加州大学圣地亚哥分校的研究人员进行了图灵测试,参与者在与四位“对话者”进行五分钟的交流后,需要判断对方是人还是机器。这四位“对话者”分别是真人、上世纪60年代的初代聊天机器人ELIZA、以及驱动聊天机器人ChatGPT的GPT-3.5和GPT-4。结果显示,有54%的参与者将GPT-4误认为真人,而人类对话者被正确辨认的比例则为67%。这表明GPT-4在图灵测试中取得了显著的成功。图灵测试是由计算机科学家艾伦・图灵在1950年提出的,测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。然而,研究人员指出,图灵测试过于简单,对话的风格和情感因素在测试中扮演着比传统智能认知更重要的角色。IEEE的人工智能研究员内尔・沃森表示,真正的智能不仅仅是智力,还包括理解情境、他人的技能并具备同理心。她认为,这些品质对于AI成为我们生活中忠诚可靠的管家至关重要。此外,这项研究也凸显了GPT时代人工智能的巨大进步,并提出了未来人机交互的挑战,人们可能会对互动对象的真实性产生疑虑,尤其是在涉及敏感话题时。