(旧金山23日综合电)美国研究人员日前声称,OpenAI旗下的AI聊天机器人ChatGPT已成为首个通过人类智力测试的“图灵测试”。自1950年首次面世以来,“图灵测试”一直被视为发展AI最高目标之一。
“图灵测试”是由计算机先驱艾伦·图灵提出的。他声称,如果人们无法区分自己是在与人还是机器交谈,那么AI就应该被认为是真正聪明。
ADVERTISEMENT
在一篇预印本论文中,来自加州大学圣迭戈分校的认知科学家认为,ChatGPT-4可以在超过一半的时间内“欺骗”人类测试对象,指其已经通过了图灵测试。
不过研究人员表示,这可能更多地说明了ChatGPT-4通过图灵测试,而不是现代AI的智能。
图灵测试是由二战英国密码破译者艾伦·图灵于1950年提出的。
他早已预言,有一天,电脑将达到能媲美人类的智力。
他提出了这项测试,以确定电脑是否具有思考能力。
在这项测试中,一个被称为“询问者”的人与另一个人和一台电脑进行基于文本的对话,然后必须辨出雌雄。
如果他们无法分辨出的话,那么计算机就通过了测试。
1950年,二战期间的英国密码破译者图灵创造了他认为是对计算机智能的终极测试。
他设想,人类参与者坐在屏幕前,通过纯文本界面与人类或计算机对话。
图灵认为,必须确定哪个是人、哪个是电脑。若无法做到,人们就不得不承认,电脑和人类一样聪明。
为了重复这项著名的测试,研究人员要求500名参与者与4个不同的智能体进行对话:3个AI机械人和一个人类。
这些人工智能包括ChatGPT-4、ChatGPT-3.5,以及1960年代的聊天程式ELIZA。
参与者被安排在聊天室中,并被告知他们要弄清楚他们在和谁说话。
然后,参与者聊天5分钟,然后被问到他们是否认为自己在与电脑或人类交谈,“为什么他们会这么想,以及他们对这想法有多大信心”。
结果发现,过时的ELIZA能成功欺骗参与者的机率只有22%;ChatGPT-3.5则在约一半情况下对话中未被发现。
至于更高级的ChatGPT-4表现更好,参与者有 54%的时间将其视之为人类。这意味着ChatGPT-4的伪装的能力更强。
如果这个数据看似很低,那么值得注意的是,在67%的对话中,参与者只正确地识别出了人类。
研究人员写道,这些结果“提供了首个强有力的实证证明,任何人工系统都可以通过图灵测试”。
值得注意的是,这是一篇预印本论文,这意味着它目前正在等待同行审核,因此在一定程度上还需谨慎看待研究结果。
然而,一旦结果获得同行认证,这将是首个强有力的证据,证明AI已像图灵设想般通过了图灵测试。
电气和电子工程师协会(IEEE)的AI研究员沃森告诉《生活科学》杂志:“机器可以虚构,像人类一样,把事情事后的合理理由混在一起。”
“所有这些因素都意味着AI系统会表现出类似人类的缺点和怪癖,这使得它们比以前的方法更像人类,而以前的方法只不过是一列预先准备好的反应。”
最终,图灵测试可能只是人类开发AI系统时需要评估的一部分。
沃森说:“原始的智力只能到此为止。真正重要的是要有足够的智慧来理解一个情况,其他人的技能,并有同理心把这些元素结合在一起。
“能力只是AI价值的一小部分,它们理解他人类价值观、偏好和界限的能力也很重要。”
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT