发布: 6:16pm 05/06/2024

斯坦福大学AI团队认抄袭向中国面壁智能道歉

（旧金山5日综合电）美国斯坦福大学人工智能（AI）团队主导的Llama3-V开源模型被证实套壳抄袭北京清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5，该团队的两位作者作出正式道歉，并承诺将撤下模型。

综合《中国日报》和《第一财经日报》等媒体报道，斯坦福Llama3-V团队的两位作者沙马和加尔格在社媒平台X上作出道歉。

他们在帖文中写道：“我们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任，并已撤下Llama3-V，再次致歉。”

沙马表示，该模型代码的作者是阿尔贾德里，他和加尔格则负责模型的推广工作。

他称，6月2日在推特上看到有关这课题的帖之后，他们曾向阿尔贾德里询问了Llama3V的原创性，并要求对方提供训练代码，但到目前为止他们还没有看到任何回复。

根据沙马和加尔格的网页资料，两人是斯坦福大学电脑科学专业的本科生；根据LinkedIn网站，阿尔贾德里毕业于南加利福尼亚大学。

事件起源于5月29日，一个斯坦福团队宣传只需500美元（约2350令吉）就可训练出一个超越GPT-4V的SOTA多模态大模型。但随即就有网民发现，团队的Llama3-V模型使用的模型结构和程式码与面壁智能不久前发布的MiniCPM-Llama3-V2.5极为相似，仅修改部分变数名称。

面壁智能团队于星期日确认，斯坦福的模型不仅能辨识出“清华简”中的战国古文字，连错误的辨识结果都与MiniCPM模型完全一致。由于上述古文字数据从未公开，因此证实抄袭事实。

面壁智能首席执行员李大海表示，公司对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式，另一方面呼吁大家共建开放、合作、有信任的社区环境。

经历此事，李大海不无感慨，“技术创新不易，每一项工作都是团队夜以继日的奋斗结果，也是以有限算力对全世界技术进步与创新发展作出的真诚奉献。我们希望团队的好工作被更多人关注与认可，但不是以这种方式。”

面壁智能联合创办人刘知远也发文表示，人工智能的飞速发展离不开全球算法、数据与模型的开源共享，让人们始终可以站在SOTA的肩上持续前进。而开源共享的基石是对开源协议的遵守，对其他贡献者的信任，对前人成果的尊重和致敬，Llama3-V团队无疑严重破坏了这一点。

他表示，他们在受到质疑后已在Huggingface删库，该团队3人中的2位也只是斯坦福大学本科生，未来还有很长的路，如果知错能改，善莫大焉。

斯坦福大学电脑科学家曼宁发文谴责抄袭行为，并对中方的MiniCPM开源模型表示赞扬。

打开全文

更多视频

中国