脸书母公司Meta Platforms推出一款人工智能模型,能够翻译和转录数十种语言的语音,是实现跨语言实时交流工具的潜在基础。
ADVERTISEMENT
英媒报道,Meta周二(22日)在一篇博客文章中表示,SeamlessM4T模型可以支持近100种语言的文本和语音翻译,以及35种语言的语音到语音翻译。
Meta总裁扎克伯格说,他设想这样的工具能够在元宇宙中促进来自全球各地用户之间的互动。
博客文章中说,Meta将这个模型提供给公众用于非商业用途。
Meta今年推出了一系列的AI模型,其中大部分是免费的。扎克伯格说,开放的AI生态系统对Meta更有利,因为公司通过有效的众包方式为其社交平台创建面向消费者的工具,比对模型的访问收费,获益更多。
对于SeamlessM4T模型,Meta的研究人员在一篇研究论文中表示,他们从约400万小时的“原始音频”中收集了音频训练数据。这些音频源自公开可用的网络数据库,只差未具体指明是哪个库。
研究论文说,文本数据来自于去年创建的数据集,这些数据集从维基百科和相关网站中提取内容。(法新社照片)
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT