(巴黎22日法新电)出版业巨头和生成式人工智能公司正在达成旨在保护版权并满足人工智能(AI)行业快速增加的需求的协议。
美国出版业巨头哈珀柯林斯出版集团(HarperCollins)已和一家未透露名字的科技公司订立合同,允许其使用部分书籍来训练生成式AI模型。
ADVERTISEMENT
根据法新社看到的信函,这家科技公司提出为每本选定的书支付2500美元,以训练其“大型语言模型”(LLM),最长3年。AI模型需要大量文本来训练其日常语言使用。
哈珀柯林斯出版集团在声明中表示:“哈珀柯林斯已与一家人工智能技术公司达成协议,允许有限使用部分非小说类旧书来训练AI模型,以提高模型素质和性能。”
它表示,该协议“范围有限,对模型输出有明确的限制,尊重作者的权利。”
声明补充,作者“可选择加入协议或放弃机会”。
出版界对这项献议的反应褒贬不一,一些作家如基布尔史密斯就冷冷地拒绝。
他在社交网络Bluesky发帖称:“我或许会为了10亿美元而这么做。我会为了一笔不需要我再工作的钱而这么做,因为这就是这项技术的最终目标。”
哈珀柯林斯是达成此类协议的最大出版商之一,但并非首家。
美国科学出版商威立(Wiley)表示,它已和一家名字保密的“大型科技公司”签订了一项价值2300万美元的合同,允许“使用以前出版的学术和专业书籍内容,特定用于培训LLM模型”。
该协议凸显了AI模型背后的紧张关系。这些模型收集了网络上的大量内容,造成了大范围侵犯版权的风险。
美国法裔开放取用AI平台Hugging Face的道德事务负责人皮斯蒂利表示,这些协议是向前迈出的一步,因为它们涉及向出版商付费。不过她遗憾的是,这些协议给予作者很少的谈判空间。
她说:“我们将会看到的是新技术公司与出版商或版权持有者之间的双边协议机制,而依我看来,我们更加需要更广泛的对话,让利益相关者参与。”
法国国家出版联盟(SNE)法律主任舒哈基认为,这些协议代表了“进步”。
他说:“达成协议意味着已经进行了对话,以及希望在受版权保护的源数据的使用,和会产生价值的源数据的使用之间取得平衡。”
新闻界也正在组织起来应对AI制造的挑战。
2023年底,《纽约时报》起诉创建ChatGPT的OpenAI公司,以及其主要投资者微软违反版权保护。其他媒体集团也与OpenAI达成了协议。
科技公司或许别无选择,只能花钱改进他们的产品,尤其是当他们开始用尽新材料来增强他们模型的能力之时。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT