(舊金山26日法新電)ChatGPT的公司OpenAI週一表示,他們正為這個長期侷限於文字提示的生成式人工智能(AI)平臺增加語音和圖片輸入的功能,使其更善於交流。
OpenAI指出,付費版本的功能允許用戶與AI對話,甚至可以“展示”他們正在談論的內容。
ADVERTISEMENT
OpenAI在一篇帖子中說:“語音和圖像為你的生活提供了更多使用聊天技術的方式。”
“在旅行時拍下一個地標的照片,並就其的有趣之處與聊天機器人進行對話。”
這些新功能的應用實例包括拍攝冰箱內部的照片,以獲得食譜建議;或拍攝孩子的數學作業的照片,就可獲得解決問題的幫助。
根據OpenAI的說法,語音和圖像輸入功能將在未來幾周內向ChatGPT Plus和企業版的用戶推出,最終將面向蘋果和谷歌的智能手機操作系統。
該公司還說:“你現在可以用語音和你的助手進行雙向對話。”
“你可以直接命令它為你的家人說一個睡前故事,或化解餐桌上的爭論。”
據這家初創公司稱,OpenAI與配音員合作,使語音交互更加逼真。
去年年底,生成式AI程序突然成為人們關注的焦點,ChatGPT透過展示了從最簡短的提示生成散文、詩歌和對話的能力震驚全球。
科技巨頭谷歌、Meta和微軟都在競相利用生成式AI的前景,同時試圖避免該技術淪為錯誤信息和網絡犯罪武器等風險。
瑞典音樂流媒體平臺Spotify週一在另一份聲明中表示,該公司正利用OpenAI技術使播客能夠翻譯成多種語言,同時保持原始揚聲器的風格。
Spotify負責個性化的副總裁蘇爾坦在一份新聞稿中說:“通過匹配創作者自己的聲音,語音翻譯讓世界各地的聽眾能夠以比以往任何時候都更真實的方式發現新播客並受到其啟發。”
Spotify表示,該公司將在未來幾周開始將英語劇集翻譯成西班牙語、法語和德語。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT