(旧金山5日综合电)美国斯坦福大学人工智能(AI)团队主导的 Llama3-V 开源模型被证实套壳抄袭北京清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5,该团队的两位作者作出正式道歉,并承诺将撤下模型。
综合《中国日报》和《第一财经日报》等媒体报道,斯坦福Llama3-V团队的两位作者沙马和加尔格在社媒平台X上作出道歉。
ADVERTISEMENT
他们在帖文中写道:“我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”
沙马表示,该模型代码的作者是阿尔贾德里,他和加尔格则负责模型的推广工作。
他称,6月2日在推特上看到有关这课题的帖之后,他们曾向阿尔贾德里询问了Llama3V 的原创性,并要求对方提供训练代码,但到目前为止他们还没有看到任何回复。”
根据沙马和加尔格的网页资料,两人是斯坦福大学电脑科学专业的本科生;根据LinkedIn网站,阿尔贾德里毕业于南加利福尼亚大学。
事件起源于5月29日,一个斯坦福团队宣传只需500美元(约2350令吉)就可训练出一个超越GPT-4V的SOTA多模态大模型。但随即就有网民发现,团队的Llama3-V模型使用的模型结构和程式码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似,仅修改部分变数名称。
面壁智能团队于星期日确认,斯坦福的模型不仅能辨识出“清华简”中的战国古文字,连错误的辨识结果都与MiniCPM模型完全一致。由于上述古文字数据从未公开,因此证实了抄袭事实。
面壁智能首席执行员李大海表示,公司对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。
经历此事,李大海不无感慨,“ 技术创新不易,每一项工作都是团队夜以继日的奋斗结果,也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”
面壁智能联合创办人刘知远也发文表示,人工智能的飞速发展离不开全球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续前进。而开源共享的基石是对开源协议的遵守,对其他贡献者的信任,对前人成果的尊重和致敬,Llama3-V团队无疑严重破坏了这一点。
他表示,他们在受到质疑后已在Huggingface删库,该团队3人中的两位也只是斯坦福大学本科生,未来还有很长的路,如果知错能改,善莫大焉。
斯坦福大学电脑科学家曼宁发文谴责抄袭行为,并对中方的MiniCPM开源模型表示赞扬。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT