(舊金山5日綜合電)美國斯坦福大學人工智能(AI)團隊主導的Llama3-V開源模型被證實套殼抄襲北京清華大學與面壁智能的開源模型“小鋼炮”MiniCPM-Llama3-V 2.5,該團隊的兩位作者作出正式道歉,並承諾將撤下模型。
綜合《中國日報》和《第一財經日報》等媒體報道,斯坦福Llama3-V團隊的兩位作者沙馬和加爾格在社媒平臺X上作出道歉。
ADVERTISEMENT
承諾撤下Llama3-V模型
他們在帖文中寫道:“我們向作者道歉,並對自己沒有努力驗證這項工作的原創性感到失望。我們對所發生的事情承擔全部責任,並已撤下Llama3-V,再次致歉。”
沙馬錶示,該模型代碼的作者是阿爾賈德里,他和加爾格則負責模型的推廣工作。
他稱,6月2日在推特上看到有關這課題的帖之後,他們曾向阿爾賈德里詢問了Llama3V的原創性,並要求對方提供訓練代碼,但到目前為止他們還沒有看到任何回覆。
根據沙馬和加爾格的網頁資料,兩人是斯坦福大學電腦科學專業的本科生;根據LinkedIn網站,阿爾賈德里畢業於南加利福尼亞大學。
事件起源於5月29日,一個斯坦福團隊宣傳只需500美元(約2350令吉)就可訓練出一個超越GPT-4V的SOTA多模態大模型。但隨即就有網民發現,團隊的Llama3-V模型使用的模型結構和程式碼與面壁智能不久前發佈的MiniCPM-Llama3-V2.5極為相似,僅修改部分變數名稱。
面壁智能團隊於星期日確認,斯坦福的模型不僅能辨識出“清華簡”中的戰國古文字,連錯誤的辨識結果都與MiniCPM模型完全一致。由於上述古文字數據從未公開,因此證實抄襲事實。
李大海:共建有信任社區環境
面壁智能首席執行員李大海表示,公司對這件事深表遺憾。一方面感慨這也是一種受到國際團隊認可的方式,另一方面呼籲大家共建開放、合作、有信任的社區環境。
經歷此事,李大海不無感慨,“技術創新不易,每一項工作都是團隊夜以繼日的奮鬥結果,也是以有限算力對全世界技術進步與創新發展作出的真誠奉獻。我們希望團隊的好工作被更多人關注與認可,但不是以這種方式。”
劉知遠:知錯能改 善莫大焉
面壁智能聯合創辦人劉知遠也發文表示,人工智能的飛速發展離不開全球算法、數據與模型的開源共享,讓人們始終可以站在SOTA的肩上持續前進。而開源共享的基石是對開源協議的遵守,對其他貢獻者的信任,對前人成果的尊重和致敬,Llama3-V團隊無疑嚴重破壞了這一點。
他表示,他們在受到質疑後已在Huggingface刪庫,該團隊3人中的2位也只是斯坦福大學本科生,未來還有很長的路,如果知錯能改,善莫大焉。
斯坦福大學電腦科學家曼寧發文譴責抄襲行為,並對中方的MiniCPM開源模型表示讚揚。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT