(羅得島14日綜合電)引領人工智能聊天機器人ChatGPT風潮的OpenAI公司此前宣佈推出的聲音複製工具──“語音引擎”,還未對外開放使用,但參與實驗的第一批人中第一個因為失去聲音而使用這個目前仍有安全爭議工具的女子卻因此受惠,她憑一段高中時演示如何製作意麵沙拉的15秒視頻中的聲音來複制自己的聲音,生成了逼真的合成語音,得以重新“遇見”自己的聲音,讓她母親眼裡擠滿感動的淚水,並幫她找回信心也重塑了她部份的身份認同。
博根一直很愛笑,高中時還是合唱團的女高音,但去年8月,醫生切除了靠近她腦後危及生命的腫瘤。一個月後,當呼吸管被拔出時,她出現吞嚥困難,向父母打招呼也很費力。數月的康復治療後,她的聲音仍無法恢復過來。
ADVERTISEMENT
但當前很多人擔心的AI技術,卻讓21歲的她在上個月恢復了“昔日的聲音”,當然不是真正的聲音,而是她打開手機應用程式召喚出來的自己的聲音。醫生團隊讓AI系統僅用她數年前的一個15秒視頻來接受訓練後,AI就合成了聽起來非常真實的聲音,現在她幾乎可以說出她想說的任何內容。
專家警告,快速改進的人工智能(AI) 語音複製技術可能會放大電話詐騙的規模,擾亂和侵犯無論是生者還是死者的尊嚴,在他們未經同意下重新創造他們的聲音並說出他們從未說過的話。
在新罕布什爾州就有人用語音複製技術模仿了美國總統拜登的聲音。而在馬里蘭州,一名高中體育主任使用AI生成學校校長髮表種族主義言論的虛假音頻片段。
但博根和羅得島壽命醫院的一組醫生相信,他們已經找到了可以合理化該風險的用途。
布朗大學醫學院和羅得島醫院的神經外科住院醫師阿里表示,隨著技術的發展,他們希望博格成為開拓者,讓數百萬虛弱的中風患者、患上咽喉癌或神經系統疾病的人可能會受益。
只需15秒就能生成有用的信息,這對在互聯網上找不到自己聲音足跡的未來患者來說,可能至關重要。因為這意味著只需給親人留下一條簡短的語音郵件就可能足夠了。
當醫生團隊第一次測試時,每個人都對博根語音複製的質量之好感到震驚。她的母親眼含淚水說道:“每次聽到她的聲音,我都會非常激動。”
博根在她的手機中輸入幾個單詞或句子,她的定製化應用程式就會立即大聲地發聲。
她現在每天使用AI語音約40次,併發送反饋,希望這能幫助到未來的患者。她的其中第一次使用體驗是與她擔任助教的幼兒園的孩子們交談。她也在商店裡用它來詢問商品擺在哪裡。
博根在一家星巴克得來速餐廳將手機舉到車窗外時,她的AI聲音說道:“嗨,能給我一杯特級冰紅糖燕麥奶昔濃縮咖啡嗎?”
她說:“我覺得我能再次聽到自己的聲音真是太棒了”,這有助於增強她的信心,並恢復她以為永遠失去的部分身份認同。
博根的醫生們已經開始複製羅得島州其他自願患者的聲音,並希望這項技術能在全球各地醫院裡使用。
OpenAI表示,他們在擴大“語音引擎”工具的使用方面謹慎行事。
其他提供商用語音生成服務的公司表示,他們禁止假冒或濫用,但他們在執行使用條款的方式上有所不同。
OpenAI的該產品負責人哈里斯表示,他們要確保該工具不會在政治背景下被使用,而OpenAI的下一步涉及開發一種安全的“語音身份驗證”工具,以便用戶只能複製自己的聲音,或是與患者合作的值得信賴的醫生才能複製患者的聲音。
ADVERTISEMENT
热门新闻
百格视频
ADVERTISEMENT