(旧金山26日法新电)ChatGPT的公司OpenAI周一表示,他们正为这个长期局限于文字提示的生成式人工智能(AI)平台增加语音和图片输入的功能,使其更善于交流。
OpenAI指出,付费版本的功能允许用户与AI对话,甚至可以“展示”他们正在谈论的内容。
ADVERTISEMENT
OpenAI在一篇帖子中说:“语音和图像为你的生活提供了更多使用聊天技术的方式。”
“在旅行时拍下一个地标的照片,并就其的有趣之处与聊天机器人进行对话。”
这些新功能的应用实例包括拍摄冰箱内部的照片,以获得食谱建议;或拍摄孩子的数学作业的照片,就可获得解决问题的帮助。
根据OpenAI的说法,语音和图像输入功能将在未来几周内向ChatGPT Plus和企业版的用户推出,最终将面向苹果和谷歌的智能手机操作系统。
该公司还说:“你现在可以用语音和你的助手进行双向对话。”
“你可以直接命令它为你的家人说一个睡前故事,或化解餐桌上的争论。”
据这家初创公司称,OpenAI与配音员合作,使语音交互更加逼真。
去年年底,生成式AI程序突然成为人们关注的焦点,ChatGPT透过展示了从最简短的提示生成散文、诗歌和对话的能力震惊全球。
科技巨头谷歌、Meta和微软都在竞相利用生成式AI的前景,同时试图避免该技术沦为错误信息和网络犯罪武器等风险。
瑞典音乐流媒体平台Spotify周一在另一份声明中表示,该公司正利用OpenAI技术使播客能够翻译成多种语言,同时保持原始扬声器的风格。
Spotify负责个性化的副总裁苏尔坦在一份新闻稿中说:“通过匹配创作者自己的声音,语音翻译让世界各地的听众能够以比以往任何时候都更真实的方式发现新播客并受到其启发。”
Spotify表示,该公司将在未来几周开始将英语剧集翻译成西班牙语、法语和德语。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT