登入
Newsletter
联络我们
登广告
关于我们
活动
热门搜索
大事件
本网站有使用Cookies,请确定同意接受才继续浏览。
了解更多
接受
您会选择新界面或旧界面?
新界面
旧界面
简
本网站有使用Cookies,请确定同意接受才继续浏览。
了解更多
接受
您会选择新界面或旧界面?
新界面
旧界面
星洲人
登广告
互动区
|
下载APP
|
简
首页
最新
头条
IG热文榜
热门
国内
即时国内
封面头条
总编推荐
暖势力
热点
全国综合
社会
政治
教育
我们
专题
发现东盟
带你来国会
星期天头条
华社
2022大选
求真
星洲人策略伙伴
星洲人互动优惠
国际
即时国际
天下事
国际头条
国际拼盘
带你看世界
坐看云起
俄乌之战
京非昔比
言路
社论
风起波生
非常常识
星期天拿铁
总编时间
骑驴看本
风雨看潮生
管理与人生
绵里藏心
亮剑
冷眼横眉
游车河
财经
股市
即时财经
焦点财经
国际财经
投资周刊
2024财政预算案
ESG专版
娱乐
即时娱乐
国外娱乐
大马娱乐
影视
地方
金典名号
大都会
大柔佛
大霹雳
砂拉越
沙巴
大北马
花城
古城
东海岸
体育
大马体育
巴黎奥运会
羽球
足球
篮球
水上
综合
场外花絮
副刊
副刊短片
专题
优活
旅游
美食
专栏
后生可为
东西
时尚
新教育
e潮
艺文
护生
看车
养生
家庭
文艺春秋
星云
人物
影音
读家
花踪
亚航新鲜事
学海
动力青年
学记
后浪坊
星洲人
VIP文
会员文
最夯
郑丁贤
非凡人物
投资理财
百格
星角攝
图说大马
国际写真
好运来
万能
多多
大马彩
热门搜索
大事件
Newsletter
登入
ADVERTISEMENT
ADVERTISEMENT
Sora
国际拼盘
文字转影片新版Sora推出 恐冲击创意产业
美国科技公司OpenAI周一推出文字生成影片的人工智能(AI)模型Sora的新版本Sora Turbo,外界担心这类AI工具对创意产业带来冲击。研发聊天机械人ChatGPT的OpenAI表示,相较今年2月推出的Sora预览版本,Sora Turbo不但生成速度更快,还能生成长达22秒的高画质影片。
2星期前
国际拼盘
焦点
【AI降陆影视业/04】零预算电影梦 AI电影创作全攻略
OpenAI推出文本转视频模型“Sora”,会依据文本指令生成复杂的摄像机运镜,还会模拟真实世界的物理规律,制作精细的场景……
4月前
焦点
焦点
【AI降陆影视业/03】AI演员精致完美 人性缺陷表演却难以复制
AI真的能取代真人从事荧幕前的工作,甚至有朝一日代替演员本尊成为影视剧的主演吗?
4月前
焦点
焦点
【AI降陆影视业/01】AI神操作冲击影视业 大师饭碗也难保?
“那时候,看到那个出来,有很多人觉得要末日了,是不是要转行了?”资深摄像师、导演陈伟团如是说。
4月前
焦点
焦点
【AI降陆影视业/02】用对AI无中生有 外行人秒当编剧
AI能协助编剧处理大量文书工作,无论是商业剧本、计划书内容,甚至是封面插图,他仅需略作修改就可。
4月前
焦点
无栏目
CEO出声警告OpenAI了,禁用YouTube视频训练Sora
最近,YouTube首席执行员尼尔·莫汉(Neal Mohan)接受Bloomberg Originals采访时说,如果OpenAI用YouTube视频训练Sora,将会违反YouTube平台的服务条款。 Sora是OpenAI旗下一款文生视频大模型,只要输入指令,便可以生成长达1分钟的视频。由于视频太过逼真,许多人想知道OpenAI的训练素材来源。 在今年3月份,《华尔街日报》记者便向OpenAI的首席技术官米拉·穆拉蒂(Mira Murati)抛问,希望能解答大众疑虑。然而,当问到OpenAI有没有用YouTube、脸书、Instagram的视频来训练Sora,她语焉不详,表示不清楚Sora的训练素材来源。作为首席技术官,这个回答令人很惊讶。 谷歌用YouTube视频训练Gemini 几个星期后,彭博社旗下的“Bloomberg Originals”与尼尔·莫汉进行采访。在采访过程中,对方坦言自己也不清楚OpenAI是否有用YouTube视频来训练Sora。如果真的有,那么肯定违反了YouTube平台的服务条款。 记者接着询问,谷歌会不会用YouTube内容来训练大语言模型“Gemini”?他答,谷歌确实有用一些YouTube视频来训练“Gemini”,但前提是创作者在上传视频到YouTube时已经有授权同意。 未来数据版权纠纷会更多 在未来,这些AI大模型会更渴望数据。因为数据越多,它的性能就越好。但如果没有明确的AI版权法案,接下来会陆续发生各种数据版权纠纷。 根据《纽约时报》4月6日的报道,OpenAI曾开发一款语音识别工具“Whisper”,将超过100万小时的YouTube视频转录成文本,作为大语言模型GPT-4的训练素材,让它变得更加智能。理论上,这个举动已经犯了视频版权,因为这些都是属于创作者的视频。 除了视频语音,OpenAI也用新闻文章来训练AI工具。《纽约时报》曾在2023年状告OpenAI和微软侵权,在未经许可的情况下,使用受版权保护的新闻文章来训练他们的AI聊天机器人。然而,这两家科技公司称,他们是依据“合理使用”的法律原则来训练AI工具。
8月前
无栏目
国际财经
OpenAI进军电影市场 拟向好莱坞推广Sora
外电报道,人工智能(AI)公司OpenAI谋求进军电影业,将向好莱坞推广旗下AI短片生成工具Sora。
9月前
国际财经
e潮
AI也能模仿声音情绪了——亚马逊推出全新的文字转语音模型
大家近期都把焦点专注在文本转视频功能,尤其OpenAI的“Sora”和谷歌的“Lumiere”。亚马逊则另辟方向,推出了一个全新的文字转语音模型“BASE TTS”,而最大亮点是该模型能够依照文本对白,表现出各种句子的“情绪”和语气。 “BASE TTS”全称是“Big Adaptive Streamable TTS with Emergent abilities”,它一共有3种数据集版本,最大的版本是“BASE-large”,拥有9.8亿个参数,并采用了来自公共网站的10万个小时语音数据来训练。另外两个版本的规模较小,分别是“BASE-small”和“BASE-medium”。前者拥有1.5亿个参数,用了1000个小时的语音数据来训练;后者有4亿个参数,用了1万个小时的语音数据来训练。 语音数据保留嘈杂的环境音 亚马逊称,整个语音数据集以英语为主(超过90%),其次是德语、荷兰语和西班牙语。这些语音数据都不是在录音室录制的“干净”声音,大多数有嘈杂的环境音。为了测试模型的能力,他们没有为语音做任何降噪或剪辑,看看这个模型能不能生成清晰的语音。 为了加强“BASE TTS”理解文本的能力,亚马逊还动手创建了一个“新兴能力测试集”,一共有7个项目,比如问题、情感、复合名词、外来词汇、句法复杂性、副语言学(Paralinguistics)和标点符号。“我们的假设随着增加‘BASE TTS’的模型容量和训练数据,模型将开始获得这些(解读)能力。” 在整个测试过程,他们发现模型参数和数据多寡会影响“BASE TTS”的能力。例如“BASE-small”是无法解释情感、语音、语调和外语词汇。相比之下,“BASE-medium”模型没问题,还能进一步掌握复合名词。“从‘BASE-small’到‘BASE-medium’,语音的自然程度明显提高了。但是从‘BASE-medium’到‘BASE-large’,提升程度较小。” “我们相信,把基于GPT的TTS模型训练时间从1000小时扩展到1万小时,然后再将模型参数从1亿增加到5亿,会让我们的TTS开始出现‘新兴能力’(emergent abilities)的转折点。” 亚马逊有将这些AI声音上传到网页(https://www.amazon.science/base-tts-samples/),而当我聆听时,真的很难辨别声音真伪。目前,这个模型还在实验阶段,亚马逊担心这种能力很可能被滥用,所以决定不公开这个模型的源代码。 相关文章: AIA引进AI面试 寻找合适人才变得容易? 谷歌生成视频把名画搞笑了 抖音测“AI搜” 想打搜索引擎主意? AI工具太方便 “内容农场”8个月内膨胀12倍 AI新闻女王登场 24/7资讯不间断
9月前
e潮
即时国际
意大利对OpenAI文生视频工具Sora展开调查
意大利数据保护局周五表示,该局已对美国OpenAI公司开发的的全新人工智能文字生成视频工具Sora展开调查。
10月前
即时国际
行呤坐詠
郑咏介.人工智能时代,不能自废武功
海水退潮的时候,就会知道是谁在裸泳。人工智能终究是我们的辅助工具,我们始终是要打好基本功才行。
10月前
行呤坐詠
国际头条
Gemini AI也出包闹笑话 谷歌人物图像生成喊停修正
美国科技大佬谷歌的Gemini人工智能(AI)模型图像生成功能近来不断出包,包括无法生成白人的照片,亦无法透过历史叙述内容生成正确人物图像而出现一些历史错误。谷歌周四宣布,正在努力解决最近出现的问题,在此过程中,将暂停人物图像的生成,并在不久后重新发布改进版本。
10月前
国际头条
e潮
谷歌生成视频把名画搞笑了
谷歌最近就发布了全新生成式AI模型“Lumiere”,能以文字创造逼真视频,完全没有抖动或闪现。
10月前
e潮
微隐于学
宋明家.AI来了,“AI”准备好了吗?
波士顿咨询集团(BCG)2023年7月的调查报告显示,我国只有17%的公司已经建立数字转型能力,远远落后于东南亚企业的47%,和全球数据的35%平均值。
10月前
微隐于学
即时国际
能凭简单文字创造视频 Sora引媒体内容创作者担忧质疑
(巴黎17日法新电)美国OpenAI公司最新一款能够以简单文字指令创造出短视频的人工智能(AI)工具已引起艺术界人士和媒体专业人员的担忧以及许多疑问。 创造ChatGPT和图像生成器DALL-E的人工智能公司OpenAI周四表示,它正在测试一款名为“Sora”的由文本转为视频模型,这模型能让用户通过简单的提示创建逼真的视频。 法国制作公司Cutback Productions的创办人兼艺术总监贝伦格一直以来都在谨慎观察生成式AI图像生成的进化。 贝伦格表示:“有人觉得,它是一个以以惊人的速度在进步的势不可挡风潮。” 他说,生成式AI的发展在其公司“内部引起了许多辩论”以及“许多有时候是发自内心的反应”。 贝伦格指出,Sora尚未正式推出,因此其能力仍有待公众测试。 他说:“肯定的是,没有人预计到仅仅数周内会有这样一个技术跃进。这是闻所未闻的。” 曾经任职记者的斯坦福大学研究员西蒙认为,“去年出现了可怕的跃进”,因为生成式AI让逼真的虚构品能够迅速地产生。 他不敢想象的是,这样的工具会如何在选举期间被滥用,并且担忧公众将“再也不知道要相信什么”。 法国电视频道法国新闻台(FranceInfo)的事实核查节目《是真是假》(Vrai ou Faux)主持人帕恩说,他也对AI工具的滥用感到忧虑。 他说:“至今,要辨认出假图像有够容易,例如通过留意背景中重复的面孔。” “这新软件所做的似乎是上了另一个层次。”
10月前
即时国际
国际头条
OpenAI推新模型Sora 文字生成影片超惊艳
美国人工智能(AI)公司OpenAI推出最新人工智能(AI)模型“Sora”,可经文字指令生成逼真的影片,不仅长度可达1分钟,而且不论画面或拟真程度,影音效果都相当出色,惊艳全球网民。
10月前
国际头条
更多Sora
下一个
结束导览