星洲网
星洲网
星洲网 登录
我的股票|星洲网 我的股票
Newsletter|星洲网 Newsletter 联络我们|星洲网 联络我们 登广告|星洲网 登广告 关于我们|星洲网 关于我们 活动|星洲网 活动
发布: 8:11pm 22/04/2024

谷歌

YouTube

AI

OpenAI

Sora

谷歌

YouTube

AI

OpenAI

Sora

CEO出聲警告OpenAI了,禁用YouTube視頻訓練Sora

报道:本刊 林德成

最近,首席執行員尼爾·莫漢(Neal Mohan)接受Bloomberg Originals採訪時說,如果用YouTube視頻訓練,將會違反YouTube平臺的服務條款。

Sora是OpenAI旗下一款文生視頻大模型,只要輸入指令,便可以生成長達1分鐘的視頻。由於視頻太過逼真,許多人想知道OpenAI的訓練素材來源。

尼爾·莫漢說,如果OpenAI用YouTube視頻訓練Sora,將會違反他們臺的服務條款。(圖:截自Bloomberg Television官方YouTube頻道)

在今年3月份,《華爾街日報》記者便向OpenAI的首席技術官米拉·穆拉蒂(Mira Murati)拋問,希望能解答大眾疑慮。然而,當問到OpenAI有沒有用YouTube、臉書、Instagram的視頻來訓練Sora,她語焉不詳,表示不清楚Sora的訓練素材來源。作為首席技術官,這個回答令人很驚訝。

米拉·穆拉蒂受訪時說,不清楚Sora的訓練素材來源。(圖:截自《華爾街日報》官方YouTube頻道)

用YouTube視頻訓練Gemini

幾個星期後,彭博社旗下的“Bloomberg Originals”與尼爾·莫漢進行採訪。在採訪過程中,對方坦言自己也不清楚OpenAI是否有用YouTube視頻來訓練Sora。如果真的有,那麼肯定違反了YouTube平臺的服務條款。

記者接著詢問,谷歌會不會用YouTube內容來訓練大語言模型“Gemini”?他答,谷歌確實有用一些YouTube視頻來訓練“Gemini”,但前提是創作者在上傳視頻到YouTube時已經有授權同意。

未來數據版權糾紛會更多

在未來,這些大模型會更渴望數據。因為數據越多,它的性能就越好。但如果沒有明確的AI版權法案,接下來會陸續發生各種數據版權糾紛。

根據《紐約時報》4月6日的報道,OpenAI曾開發一款語音識別工具“Whisper”,將超過100萬小時的YouTube視頻轉錄成文本,作為大語言模型GPT-4的訓練素材,讓它變得更加智能。理論上,這個舉動已經犯了視頻版權,因為這些都是屬於創作者的視頻。

除了視頻語音,OpenAI也用新聞文章來訓練AI工具。《紐約時報》曾在2023年狀告OpenAI和微軟侵權,在未經許可的情況下,使用受版權保護的新聞文章來訓練他們的AI聊天機器人。然而,這兩家科技公司稱,他們是依據“合理使用”的法律原則來訓練AI工具。

打开全文

热门新闻

百格视频

点击 可阅读下一则新闻