(舊金山23日綜合電)美國研究人員日前聲稱,OpenAI旗下的AI聊天機器人ChatGPT已成為首個通過人類智力測試的“圖靈測試”。自1950年首次面世以來,“圖靈測試”一直被視為發展AI最高目標之一。
“圖靈測試”是由計算機先驅艾倫·圖靈提出的。他聲稱,如果人們無法區分自己是在與人還是機器交談,那麼AI就應該被認為是真正聰明。
ADVERTISEMENT
在一篇預印本論文中,來自加州大學聖迭戈分校的認知科學家認為,ChatGPT-4可以在超過一半的時間內“欺騙”人類測試對象,指其已經通過了圖靈測試。
不過研究人員表示,這可能更多地說明了ChatGPT-4通過圖靈測試,而不是現代AI的智能。
圖靈測試是由二戰英國密碼破譯者艾倫·圖靈於1950年提出的。
他早已預言,有一天,電腦將達到能媲美人類的智力。
他提出了這項測試,以確定電腦是否具有思考能力。
在這項測試中,一個被稱為“詢問者”的人與另一個人和一臺電腦進行基於文本的對話,然後必須辨出雌雄。
如果他們無法分辨出的話,那麼計算機就通過了測試。
1950年,二戰期間的英國密碼破譯者圖靈創造了他認為是對計算機智能的終極測試。
他設想,人類參與者坐在屏幕前,通過純文本界面與人類或計算機對話。
圖靈認為,必須確定哪個是人、哪個是電腦。若無法做到,人們就不得不承認,電腦和人類一樣聰明。
為了重複這項著名的測試,研究人員要求500名參與者與4個不同的智能體進行對話:3個AI機械人和一個人類。
這些人工智能包括ChatGPT-4、ChatGPT-3.5,以及1960年代的聊天程式ELIZA。
參與者被安排在聊天室中,並被告知他們要弄清楚他們在和誰說話。
然後,參與者聊天5分鐘,然後被問到他們是否認為自己在與電腦或人類交談,“為什麼他們會這麼想,以及他們對這想法有多大信心”。
結果發現,過時的ELIZA能成功欺騙參與者的機率只有22%;ChatGPT-3.5則在約一半情況下對話中未被發現。
至於更高級的ChatGPT-4表現更好,參與者有 54%的時間將其視之為人類。這意味著ChatGPT-4的偽裝的能力更強。
如果這個數據看似很低,那麼值得注意的是,在67%的對話中,參與者只正確地識別出了人類。
研究人員寫道,這些結果“提供了首個強有力的實證證明,任何人工系統都可以通過圖靈測試”。
值得注意的是,這是一篇預印本論文,這意味著它目前正在等待同行審核,因此在一定程度上還需謹慎看待研究結果。
然而,一旦結果獲得同行認證,這將是首個強有力的證據,證明AI已像圖靈設想般通過了圖靈測試。
電氣和電子工程師協會(IEEE)的AI研究員沃森告訴《生活科學》雜誌:“機器可以虛構,像人類一樣,把事情事後的合理理由混在一起。”
“所有這些因素都意味著AI系統會表現出類似人類的缺點和怪癖,這使得它們比以前的方法更像人類,而以前的方法只不過是一列預先準備好的反應。”
最終,圖靈測試可能只是人類開發AI系統時需要評估的一部分。
沃森說:“原始的智力只能到此為止。真正重要的是要有足夠的智慧來理解一個情況,其他人的技能,並有同理心把這些元素結合在一起。
“能力只是AI價值的一小部分,它們理解他人類價值觀、偏好和界限的能力也很重要。”
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT