Sora新闻资料

简

ADVERTISEMENT

ADVERTISEMENT

国际拼盘

文字转影片新版Sora推出恐冲击创意产业

美国科技公司OpenAI周一推出文字生成影片的人工智能（AI）模型Sora的新版本Sora Turbo，外界担心这类AI工具对创意产业带来冲击。研发聊天机械人ChatGPT的OpenAI表示，相较今年2月推出的Sora预览版本，Sora Turbo不但生成速度更快，还能生成长达22秒的高画质影片。

2星期前

国际拼盘

焦点

【AI降陆影视业／04】零预算电影梦 AI电影创作全攻略

OpenAI推出文本转视频模型“Sora”，会依据文本指令生成复杂的摄像机运镜，还会模拟真实世界的物理规律，制作精细的场景……

4月前

焦点

焦点

【AI降陆影视业／03】AI演员精致完美人性缺陷表演却难以复制

AI真的能取代真人从事荧幕前的工作，甚至有朝一日代替演员本尊成为影视剧的主演吗？

4月前

焦点

焦点

【AI降陆影视业／01】AI神操作冲击影视业大师饭碗也难保？

“那时候，看到那个出来，有很多人觉得要末日了，是不是要转行了？”资深摄像师、导演陈伟团如是说。

4月前

焦点

焦点

【AI降陆影视业／02】用对AI无中生有外行人秒当编剧

AI能协助编剧处理大量文书工作，无论是商业剧本、计划书内容，甚至是封面插图，他仅需略作修改就可。

4月前

焦点

无栏目

CEO出声警告OpenAI了，禁用YouTube视频训练Sora

最近，YouTube首席执行员尼尔·莫汉（Neal Mohan）接受Bloomberg Originals采访时说，如果OpenAI用YouTube视频训练Sora，将会违反YouTube平台的服务条款。 Sora是OpenAI旗下一款文生视频大模型，只要输入指令，便可以生成长达1分钟的视频。由于视频太过逼真，许多人想知道OpenAI的训练素材来源。在今年3月份，《华尔街日报》记者便向OpenAI的首席技术官米拉·穆拉蒂（Mira Murati）抛问，希望能解答大众疑虑。然而，当问到OpenAI有没有用YouTube、脸书、Instagram的视频来训练Sora，她语焉不详，表示不清楚Sora的训练素材来源。作为首席技术官，这个回答令人很惊讶。谷歌用YouTube视频训练Gemini 几个星期后，彭博社旗下的“Bloomberg Originals”与尼尔·莫汉进行采访。在采访过程中，对方坦言自己也不清楚OpenAI是否有用YouTube视频来训练Sora。如果真的有，那么肯定违反了YouTube平台的服务条款。记者接着询问，谷歌会不会用YouTube内容来训练大语言模型“Gemini”？他答，谷歌确实有用一些YouTube视频来训练“Gemini”，但前提是创作者在上传视频到YouTube时已经有授权同意。未来数据版权纠纷会更多在未来，这些AI大模型会更渴望数据。因为数据越多，它的性能就越好。但如果没有明确的AI版权法案，接下来会陆续发生各种数据版权纠纷。根据《纽约时报》4月6日的报道，OpenAI曾开发一款语音识别工具“Whisper”，将超过100万小时的YouTube视频转录成文本，作为大语言模型GPT-4的训练素材，让它变得更加智能。理论上，这个举动已经犯了视频版权，因为这些都是属于创作者的视频。除了视频语音，OpenAI也用新闻文章来训练AI工具。《纽约时报》曾在2023年状告OpenAI和微软侵权，在未经许可的情况下，使用受版权保护的新闻文章来训练他们的AI聊天机器人。然而，这两家科技公司称，他们是依据“合理使用”的法律原则来训练AI工具。

8月前

无栏目

国际财经

OpenAI进军电影市场拟向好莱坞推广Sora

外电报道，人工智能（AI）公司OpenAI谋求进军电影业，将向好莱坞推广旗下AI短片生成工具Sora。

9月前

国际财经

e潮

AI也能模仿声音情绪了——亚马逊推出全新的文字转语音模型

大家近期都把焦点专注在文本转视频功能，尤其OpenAI的“Sora”和谷歌的“Lumiere”。亚马逊则另辟方向，推出了一个全新的文字转语音模型“BASE TTS”，而最大亮点是该模型能够依照文本对白，表现出各种句子的“情绪”和语气。 “BASE TTS”全称是“Big Adaptive Streamable TTS with Emergent abilities”，它一共有3种数据集版本，最大的版本是“BASE-large”，拥有9.8亿个参数，并采用了来自公共网站的10万个小时语音数据来训练。另外两个版本的规模较小，分别是“BASE-small”和“BASE-medium”。前者拥有1.5亿个参数，用了1000个小时的语音数据来训练；后者有4亿个参数，用了1万个小时的语音数据来训练。语音数据保留嘈杂的环境音亚马逊称，整个语音数据集以英语为主（超过90%），其次是德语、荷兰语和西班牙语。这些语音数据都不是在录音室录制的“干净”声音，大多数有嘈杂的环境音。为了测试模型的能力，他们没有为语音做任何降噪或剪辑，看看这个模型能不能生成清晰的语音。为了加强“BASE TTS”理解文本的能力，亚马逊还动手创建了一个“新兴能力测试集”，一共有7个项目，比如问题、情感、复合名词、外来词汇、句法复杂性、副语言学（Paralinguistics）和标点符号。“我们的假设随着增加‘BASE TTS’的模型容量和训练数据，模型将开始获得这些（解读）能力。” 在整个测试过程，他们发现模型参数和数据多寡会影响“BASE TTS”的能力。例如“BASE-small”是无法解释情感、语音、语调和外语词汇。相比之下，“BASE-medium”模型没问题，还能进一步掌握复合名词。“从‘BASE-small’到‘BASE-medium’，语音的自然程度明显提高了。但是从‘BASE-medium’到‘BASE-large’，提升程度较小。” “我们相信，把基于GPT的TTS模型训练时间从1000小时扩展到1万小时，然后再将模型参数从1亿增加到5亿，会让我们的TTS开始出现‘新兴能力’（emergent abilities）的转折点。” 亚马逊有将这些AI声音上传到网页（https://www.amazon.science/base-tts-samples/），而当我聆听时，真的很难辨别声音真伪。目前，这个模型还在实验阶段，亚马逊担心这种能力很可能被滥用，所以决定不公开这个模型的源代码。相关文章： AIA引进AI面试寻找合适人才变得容易？谷歌生成视频把名画搞笑了抖音测“AI搜” 想打搜索引擎主意？ AI工具太方便 “内容农场”8个月内膨胀12倍 AI新闻女王登场 24/7资讯不间断

9月前

e潮

即时国际

意大利对OpenAI文生视频工具Sora展开调查

意大利数据保护局周五表示，该局已对美国OpenAI公司开发的的全新人工智能文字生成视频工具Sora展开调查。

10月前

即时国际

行呤坐詠

郑咏介.人工智能时代，不能自废武功

海水退潮的时候，就会知道是谁在裸泳。人工智能终究是我们的辅助工具，我们始终是要打好基本功才行。

10月前

行呤坐詠

国际头条

Gemini AI也出包闹笑话谷歌人物图像生成喊停修正

美国科技大佬谷歌的Gemini人工智能（AI）模型图像生成功能近来不断出包，包括无法生成白人的照片，亦无法透过历史叙述内容生成正确人物图像而出现一些历史错误。谷歌周四宣布，正在努力解决最近出现的问题，在此过程中，将暂停人物图像的生成，并在不久后重新发布改进版本。

10月前

国际头条

e潮

谷歌生成视频把名画搞笑了

谷歌最近就发布了全新生成式AI模型“Lumiere”，能以文字创造逼真视频，完全没有抖动或闪现。

10月前

e潮

微隐于学

宋明家.AI来了，“AI”准备好了吗？

波士顿咨询集团（BCG）2023年7月的调查报告显示，我国只有17%的公司已经建立数字转型能力，远远落后于东南亚企业的47%，和全球数据的35%平均值。

10月前

微隐于学

即时国际

能凭简单文字创造视频 Sora引媒体内容创作者担忧质疑

（巴黎17日法新电）美国OpenAI公司最新一款能够以简单文字指令创造出短视频的人工智能（AI）工具已引起艺术界人士和媒体专业人员的担忧以及许多疑问。创造ChatGPT和图像生成器DALL-E的人工智能公司OpenAI周四表示，它正在测试一款名为“Sora”的由文本转为视频模型，这模型能让用户通过简单的提示创建逼真的视频。法国制作公司Cutback Productions的创办人兼艺术总监贝伦格一直以来都在谨慎观察生成式AI图像生成的进化。贝伦格表示：“有人觉得，它是一个以以惊人的速度在进步的势不可挡风潮。” 他说，生成式AI的发展在其公司“内部引起了许多辩论”以及“许多有时候是发自内心的反应”。贝伦格指出，Sora尚未正式推出，因此其能力仍有待公众测试。他说：“肯定的是，没有人预计到仅仅数周内会有这样一个技术跃进。这是闻所未闻的。” 曾经任职记者的斯坦福大学研究员西蒙认为，“去年出现了可怕的跃进”，因为生成式AI让逼真的虚构品能够迅速地产生。他不敢想象的是，这样的工具会如何在选举期间被滥用，并且担忧公众将“再也不知道要相信什么”。法国电视频道法国新闻台（FranceInfo）的事实核查节目《是真是假》（Vrai ou Faux）主持人帕恩说，他也对AI工具的滥用感到忧虑。他说：“至今，要辨认出假图像有够容易，例如通过留意背景中重复的面孔。” “这新软件所做的似乎是上了另一个层次。”

10月前

即时国际

国际头条

OpenAI推新模型Sora 文字生成影片超惊艳

美国人工智能（AI）公司OpenAI推出最新人工智能（AI）模型“Sora”，可经文字指令生成逼真的影片，不仅长度可达1分钟，而且不论画面或拟真程度，影音效果都相当出色，惊艳全球网民。

10月前

国际头条