(北京29日綜合電)根據一項衡量自然語言處理(NLP)的基準測試,中國兩大科技巨頭騰訊控股和阿里巴巴集團的人工智能(AI)模型的理解中文能力比人類更強。
這兩個競爭對手的人工智能模型在中文語言理解測評基準(CLUE)測試取得破紀錄高分。這項測試是通過一套任務來評估機器像人類那樣對中文字的理解和反應能力。
ADVERTISEMENT
這也是自數十名研究人員在3年前設立CLUE基準以來,人工智能模型首次得分高於人類。
根據週一的CLUE網站排名,騰訊的“混元AI大模型”以86.918分高居榜首,隨後是阿里巴巴的AliceMind,得86.685分。兩者都贏了得86.678分的人類。
另外,中國智能手機制造商Oppo和外賣配送巨頭美團的人工智能模型則分別排名第四和第五。
阿里巴巴集團旗下雲計算公司阿里雲在上週五發表一篇文章說:“雖然排名大有改變,得分最高者迄今不曾超越人類。”它補充,最新的成績意味著,“人工智能模型對中文的理解已達到新的水平。”
中國的科技巨頭一直都在致力於改進其自然語言處理技術。這項技術用來支援聲控虛擬助理,如阿里巴巴的阿里精靈(AliGenie)和騰訊的小微,以及其他功能,如機器翻譯和垃圾郵件檢測。
今年較早時,中國互聯網搜索巨頭百度表示,其虛擬助手度曉曉寫的一篇文章雖然誤用了一個網絡用語,得分還比大多數中國高考考生來得高。
儘管如此,一些研究人員認為,大多數人工智能模型要真正瞭解語言的錯綜複雜,還有很長的路要走。
去年,美國亞拉巴馬州奧本大學的科學家們以及美國軟件公司Adobe的研究單位發現,許多在某些理解任務上表現勝於人類的人工智能模型在一個句子內的文字吊亂時無法說出。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT