a&s專業(yè)的自動化&安全生態(tài)服務平臺

公眾號

安全自動化

安防知識網(wǎng)

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應用搜索

首頁 > 資訊 > 正文

聲?？萍迹褐悄芴摂M人大火的背后或引起爭議?

作者：宋笑旭 2019-07-12 09:30 閱讀 3545 來源：安防知識網(wǎng) 評論區(qū)

虛擬人作為一個新興事物，其應用范圍的擴展、使用頻率的提高是一個必然的趨勢，伴隨著硬件技術與傳播理念的不斷演進，虛擬人在分類、潛在優(yōu)勢挖掘、跨媒體使用等方面將會大有長進，未來還將在娛樂、客服、醫(yī)療健康、教育、法律等多個領域提供個性化的內(nèi)容。終有一日，如同機器人必將走進我們的生活當中一樣，它會給我們現(xiàn)有的格局帶來一個全新的詮釋。

　　隨著科技的進步和社會的發(fā)展，我們已經(jīng)從互聯(lián)網(wǎng)時代跨入了人工智能時代。人工智能時代和互聯(lián)網(wǎng)時代最大的差別就是互聯(lián)網(wǎng)的紅利漸漸開始消失，現(xiàn)在說已經(jīng)進入人工智能時代還為時過早，二十已經(jīng)進入互聯(lián)網(wǎng)+的時代，互聯(lián)網(wǎng)+即解決信息不對稱和連接問題，例如淘寶將用戶與賣家連接到一起，滴滴把司機和乘客連接到一起。但是互聯(lián)網(wǎng)+解決了連接問題，還有很多問題沒有解決，如效率和成本。

　　用人工智能代替生產(chǎn)力是未來的大勢所趨。比如采用虛擬機器人代替醫(yī)生做簡單的手術，用虛擬老師教授知識，用語音識別代替會議記錄員等等。人工智能的應用提高了生產(chǎn)力，降低了成本。所以與互聯(lián)網(wǎng)相比，未來我們更應該關注人工智能。

　　人機交互界面變遷

　　說起人工智能的發(fā)展，就不得不提人機交互，初期的人機器交互是通過模板實現(xiàn)，漸漸的衍生到用cmd交互，到現(xiàn)在變成了圖形化界面的人機交互。未來圖形人機交互的發(fā)展方向是大家都應該關注的話題。

　　目前主流的人機交互發(fā)展方向是采用更自然的方式實現(xiàn)，因此語音交互就走入人們的視野。語音交互的優(yōu)勢是不需要用手、眼睛，例如開車時可以直接命令設備播放音樂、新聞等。而與設備的人機交互并不能滿足日益增長的社會需求，從而就催始了智能虛擬人的研發(fā)。

　　智能虛擬人其實就是用技術模擬人體的各個器官，如用自然語言處理/對話系統(tǒng)模擬人的大腦，用圖像識別技術模擬人的眼睛，用語音識別/發(fā)音糾錯模擬人的耳朵，用語音合成模擬人的嘴巴，另外用最新的audio to video虛擬出人的形象，從而智能虛擬人誕生了。

　　智能虛擬人的四大核心技術

　　在實際的應用中，與智能虛擬人直接交互需要用到四大核心技術。

　　第一，發(fā)音糾錯/語音識別。發(fā)音糾錯技術顧名思義就是糾正人的發(fā)音問題。在實際應用最多的案例就是虛擬老師，與虛擬老師的交互過程中，機器可以明確的指出發(fā)音錯誤的地方，糾正范圍包含全面，如音標、長短音、語調(diào)等，可以實現(xiàn)精細化糾正，并形成學習報告，便于課后的復習掌握。

3-核心技術1.jpg

　　第二，自然語言處理/對話系統(tǒng)。語言學習過程中，除了需要糾正發(fā)音外，還需要場景的聯(lián)系，而虛擬人陪練就可以隨時隨地的實現(xiàn)這個目標。在模擬場景中，虛擬人通過角色扮演，完成多輪的對話。從而達到聯(lián)系的目的。

　　第三，個性化語音合成。人類語言的個性化體現(xiàn)在音色的層面，個性化語音合成技術可以定制特定人的聲音，實現(xiàn)將任何一個人的聲音變成另外一個人的聲音。如可以在保持錄音內(nèi)容不變的情況下，將錄音中的聲音變成林志玲、奧巴馬等名人的聲音，也可以將男人的聲音變成女人的聲音。通過少量的音頻數(shù)據(jù)，訓練完成后即可以變換成特定的聲音。該項技術可以應用在電影電視配音、虛擬老師學習等場景。例如，在英語學習時用自己的聲音代替標準發(fā)音，體會自己標準發(fā)音，從而排除音色干擾，提高學習效率;將兒童故事機器人中陌生人的聲音轉換成小孩爸爸媽媽的聲音，給小孩講故事，具有更大的吸引力和趣味性。

　　第四，圖像/視頻處理。通過定制化虛擬出需要的形象。除了輸出聲音，還可以合成視頻。

　　目前有兩種合成視頻的模式，第一種是將原始的音視頻與新的音頻結合，合成新的音視頻。只需要錄制一段音頻就可以合成視頻，可以明顯的降低視頻錄制時間。例如外教英語視頻錄制，只需要錄制一些視頻片段，后續(xù)如果需要補錄的話成本較高，就可以直接補錄一段音頻，與原視頻合成后形成需要補錄的視頻，降低了錄制的成本。

　　第二種是只要有原始的音視頻和新的文本，直接從文本合成視頻，相對來說技術更加復雜，難度更大。

6-核心技術4.jpg

　　應用場景眾多

　　智能虛擬人的應用場景可以覆蓋許多領域，包含有教育、娛樂、客服(金融/電信/電商)、旅游等領域。

　　首先，教育領域的虛擬老師，虛擬老師英語教學已經(jīng)有很多應用的案例，通過英語學習類APP或者智能硬件(智能平板、智能機器人)幫培訓機構解決外教問題，虛擬老師和真人的助教配合，實現(xiàn)雙師課堂。教育的教書部分，即傳遞知識方面由機器完成，育人需要助教實施，教書是重復性的勞動，機器會比人更擅長。

　　虛擬機器人可以在學習中實現(xiàn)個性化的反饋，通過學生答題器，精準掌握學生學習情況，針對錯誤和易混淆單詞設置課后復習，做到因材施教。這種課程方式相比于傳統(tǒng)的大班課有很大的優(yōu)勢，基于虛擬人技術和數(shù)據(jù)，搭配助教和人臉識別、情緒識別技術，就可以形成高質(zhì)量的教育課程。

　　其次，娛樂領域的虛擬主播，實現(xiàn)時效性的新聞播報，傳統(tǒng)的真人主播需要錄音、剪輯后播報，影響時效性，真人實時出鏡時效性高的新聞對主播的要求高。虛擬主播只要輸入音頻或者文字，就可以把新聞播報出來，簡單、便捷、成本低。

　　另外，目前較為流行的游戲的解說主播，也可以通過虛擬形象+真人主持的模式實現(xiàn)。主播有真實頭像會比只有音頻播放量高十倍。

　　通過虛擬主播幫助媒體融合轉型，在新聞時效性和跨語種傳播能力等方面再上臺階，實現(xiàn)了在不同場景下更為自然的人機交互，

　　再次，虛擬客服，銀行傳統(tǒng)的真人窗口服務逐漸演變?yōu)楝F(xiàn)在的機器+遠程真人驗證服務，而用虛擬客服后，開戶、驗證都可以實現(xiàn)，如有突發(fā)情況再真人參與，大大降低人力成本。

　　最后，旅游領域的智能導游，傳統(tǒng)需要導游講解景點、歷史文化等。用機器替代真人實現(xiàn)智能導游，可以手機APP智能講解、簡單互動，如廁所、景點、餐館的地址查詢互動，也可以通過智能感應游客后音頻講解。

　　未來智能虛擬人的引用可以實現(xiàn)自由對話，可以教我們學語言，也可以播新聞，更可以實時滿足人類的交互需求。

　　可能引發(fā)犯罪問題?

　　技術是把雙刃劍，能豐富和改變我們的生活，也能改變我們認知。技術在一方面的確可以幫助我們，但如果惡意使用，可能就會造成很大負面的影響，而智能虛擬人技術的發(fā)展應用也存在需要防范的問題。

20180622233_74228032(1).jpg

　　AI技術已能達到構建完全虛擬的人物面孔和動物形態(tài)，人工智能和神經(jīng)網(wǎng)絡技術可以用來輕易的虛構圖片和視頻使人們對此深信不疑，畢竟眼見為實嘛!小編擔心，如果工具被惡意利用，制造假新聞、惡作劇、電話詐騙等，如名人發(fā)布講話被篡改，合成語音的騷擾電話、詐騙電話時，我們又該怎么解決?

　　答案就是聲紋識別，通過聲紋識別技術可以對視頻進行鑒定，去確定視頻中是否本人講話，甚至可以判斷出聲音是合成還是轉換的。而我們正規(guī)利用虛擬人時也可以通過技術的方式，將合成的視頻做標記，以防止被其他不法分子利用。

　　小結

　　虛擬人作為一個新興事物，其應用范圍的擴展、使用頻率的提高是一個必然的趨勢，伴隨著硬件技術與傳播理念的不斷演進，虛擬人在分類、潛在優(yōu)勢挖掘、跨媒體使用等方面將會大有長進，未來還將在娛樂、客服、醫(yī)療健康、教育、法律等多個領域提供個性化的內(nèi)容。終有一日，如同機器人必將走進我們的生活當中一樣，它會給我們現(xiàn)有的格局帶來一個全新的詮釋。

　　以上部分內(nèi)容根據(jù)聲希科技聯(lián)合創(chuàng)始人孫立發(fā)博士在2019年人工智能技術峰會AI圖像與語音識別技術上的演講整理

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

您可能也喜歡這些文章

參與評論

回復：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

聲?？萍迹褐悄芴摂M人大火的背后或引起爭議?