一家名為“華麗琴鳥”(Lyrebird)的加拿大初創(chuàng)公司發(fā)明了一套人工智能系統(tǒng),用戶只需使用一段長(zhǎng)約1分鐘的錄音,便可合成講話者的聲音。該人工智能系統(tǒng)可利用語(yǔ)音模仿算法仿制某人的聲音,還能聲情并茂地朗讀各類文本,雖然這一語(yǔ)音復(fù)制技術(shù)聽上去挺有趣,但也可能產(chǎn)生嚴(yán)重后果,因?yàn)槭褂谜呖捎闷浼倜八松矸荨?/p>
該初創(chuàng)公司以蒙特利爾大學(xué)博士生們研發(fā)的深度學(xué)習(xí)模型為基礎(chǔ)。公司名為“華麗琴鳥”,這是一種原產(chǎn)澳大利亞的鳥類,可同時(shí)模仿20種不同生物的聲音。
該公司使用人工智能系統(tǒng),將一段語(yǔ)音中的個(gè)人特征壓縮成一段獨(dú)特的編碼。研發(fā)人員稱,將該編碼輸入算法后,不到半秒鐘便可生成1000個(gè)句子,該算法不僅能合成語(yǔ)音,還能對(duì)聲音進(jìn)行控制,賦予其憤怒、同情或緊張等情感,官網(wǎng)上以特朗普、奧巴馬和希拉里的聲音為例,演示了該技術(shù)的準(zhǔn)確程度。
研發(fā)人員稱,這一技術(shù)可得到廣泛運(yùn)用,如充當(dāng)個(gè)人助理、用名人的聲音閱讀有聲書、或?yàn)闅埣踩撕铣?ldquo;演講”等,在動(dòng)漫電影和視頻游戲中也將有用武之地。
“錄音常被視作強(qiáng)有力的證據(jù),許多國(guó)家的司法系統(tǒng)尤其看重這一點(diǎn)。而不法分子可利用我們發(fā)明的技術(shù)輕易操縱錄音,從而破壞了錄音作為證據(jù)的可信度。”研發(fā)人員承認(rèn),該技術(shù)可能導(dǎo)致危險(xiǎn)后果,如“通過竊取他人身份誤導(dǎo)外交官、或進(jìn)行欺詐等”,該團(tuán)隊(duì)認(rèn)為,等到該技術(shù)對(duì)公眾開放之后,錄音便不應(yīng)被視作驗(yàn)明正身的證據(jù)。
該公司表示,這一技術(shù)目前仍處在研發(fā)階段,且未提及具體發(fā)布時(shí)間及費(fèi)用。