中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

a&s專業(yè)的自動化&安全生態(tài)服務平臺
公眾號
安全自動化

安全自動化

安防知識網(wǎng)

安防知識網(wǎng)

手機站
手機站

手機站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

聲??萍迹褐悄芴摂M人大火的背后或引起爭議?

虛擬人作為一個新興事物,其應用范圍的擴展、使用頻率的提高是一個必然的趨勢,伴隨著硬件技術與傳播理念的不斷演進,虛擬人在分類、潛在優(yōu)勢挖掘、跨媒體使用等方面將會大有長進,未來還將在娛樂、客服、醫(yī)療健康、教育、法律等多個領域提供個性化的內(nèi)容。終有一日,如同機器人必將走進我們的生活當中一樣,它會給我們現(xiàn)有的格局帶來一個全新的詮釋。
資訊頻道文章B

  隨著科技的進步和社會的發(fā)展,我們已經(jīng)從互聯(lián)網(wǎng)時代跨入了人工智能時代。人工智能時代和互聯(lián)網(wǎng)時代最大的差別就是互聯(lián)網(wǎng)的紅利漸漸開始消失,現(xiàn)在說已經(jīng)進入人工智能時代還為時過早,二十已經(jīng)進入互聯(lián)網(wǎng)+的時代,互聯(lián)網(wǎng)+即解決信息不對稱和連接問題,例如淘寶將用戶與賣家連接到一起,滴滴把司機和乘客連接到一起。但是互聯(lián)網(wǎng)+解決了連接問題,還有很多問題沒有解決,如效率和成本。

  用人工智能代替生產(chǎn)力是未來的大勢所趨。比如采用虛擬機器人代替醫(yī)生做簡單的手術,用虛擬老師教授知識,用語音識別代替會議記錄員等等。人工智能的應用提高了生產(chǎn)力,降低了成本。所以與互聯(lián)網(wǎng)相比,未來我們更應該關注人工智能。

20180516340_34284365_xxl.jpg

  人機交互界面變遷

  說起人工智能的發(fā)展,就不得不提人機交互,初期的人機器交互是通過模板實現(xiàn),漸漸的衍生到用cmd交互,到現(xiàn)在變成了圖形化界面的人機交互。未來圖形人機交互的發(fā)展方向是大家都應該關注的話題。

  目前主流的人機交互發(fā)展方向是采用更自然的方式實現(xiàn),因此語音交互就走入人們的視野。語音交互的優(yōu)勢是不需要用手、眼睛,例如開車時可以直接命令設備播放音樂、新聞等。而與設備的人機交互并不能滿足日益增長的社會需求,從而就催始了智能虛擬人的研發(fā)。

  智能虛擬人其實就是用技術模擬人體的各個器官,如用自然語言處理/對話系統(tǒng)模擬人的大腦,用圖像識別技術模擬人的眼睛,用語音識別/發(fā)音糾錯模擬人的耳朵,用語音合成模擬人的嘴巴,另外用最新的audio to video虛擬出人的形象,從而智能虛擬人誕生了。

  智能虛擬人的四大核心技術

  在實際的應用中,與智能虛擬人直接交互需要用到四大核心技術。

  第一,發(fā)音糾錯/語音識別。發(fā)音糾錯技術顧名思義就是糾正人的發(fā)音問題。在實際應用最多的案例就是虛擬老師,與虛擬老師的交互過程中,機器可以明確的指出發(fā)音錯誤的地方,糾正范圍包含全面,如音標、長短音、語調(diào)等,可以實現(xiàn)精細化糾正,并形成學習報告,便于課后的復習掌握。

3-核心技術1.jpg

  第二,自然語言處理/對話系統(tǒng)。語言學習過程中,除了需要糾正發(fā)音外,還需要場景的聯(lián)系,而虛擬人陪練就可以隨時隨地的實現(xiàn)這個目標。在模擬場景中,虛擬人通過角色扮演,完成多輪的對話。從而達到聯(lián)系的目的。

  第三,個性化語音合成。人類語言的個性化體現(xiàn)在音色的層面,個性化語音合成技術可以定制特定人的聲音,實現(xiàn)將任何一個人的聲音變成另外一個人的聲音。如可以在保持錄音內(nèi)容不變的情況下,將錄音中的聲音變成林志玲、奧巴馬等名人的聲音,也可以將男人的聲音變成女人的聲音。通過少量的音頻數(shù)據(jù),訓練完成后即可以變換成特定的聲音。該項技術可以應用在電影電視配音、虛擬老師學習等場景。例如,在英語學習時用自己的聲音代替標準發(fā)音,體會自己標準發(fā)音,從而排除音色干擾,提高學習效率;將兒童故事機器人中陌生人的聲音轉換成小孩爸爸媽媽的聲音,給小孩講故事,具有更大的吸引力和趣味性。

  第四,圖像/視頻處理。通過定制化虛擬出需要的形象。除了輸出聲音,還可以合成視頻。

  目前有兩種合成視頻的模式,第一種是將原始的音視頻與新的音頻結合,合成新的音視頻。只需要錄制一段音頻就可以合成視頻,可以明顯的降低視頻錄制時間。例如外教英語視頻錄制,只需要錄制一些視頻片段,后續(xù)如果需要補錄的話成本較高,就可以直接補錄一段音頻,與原視頻合成后形成需要補錄的視頻,降低了錄制的成本。

  第二種是只要有原始的音視頻和新的文本,直接從文本合成視頻,相對來說技術更加復雜,難度更大。

6-核心技術4.jpg

  應用場景眾多

  智能虛擬人的應用場景可以覆蓋許多領域,包含有教育、娛樂、客服(金融/電信/電商)、旅游等領域。

  首先,教育領域的虛擬老師,虛擬老師英語教學已經(jīng)有很多應用的案例,通過英語學習類APP或者智能硬件(智能平板、智能機器人)幫培訓機構解決外教問題,虛擬老師和真人的助教配合,實現(xiàn)雙師課堂。教育的教書部分,即傳遞知識方面由機器完成,育人需要助教實施,教書是重復性的勞動,機器會比人更擅長。

  虛擬機器人可以在學習中實現(xiàn)個性化的反饋,通過學生答題器,精準掌握學生學習情況,針對錯誤和易混淆單詞設置課后復習,做到因材施教。這種課程方式相比于傳統(tǒng)的大班課有很大的優(yōu)勢,基于虛擬人技術和數(shù)據(jù),搭配助教和人臉識別、情緒識別技術,就可以形成高質(zhì)量的教育課程。

  其次,娛樂領域的虛擬主播,實現(xiàn)時效性的新聞播報,傳統(tǒng)的真人主播需要錄音、剪輯后播報,影響時效性,真人實時出鏡時效性高的新聞對主播的要求高。虛擬主播只要輸入音頻或者文字,就可以把新聞播報出來,簡單、便捷、成本低。

  另外,目前較為流行的游戲的解說主播,也可以通過虛擬形象+真人主持的模式實現(xiàn)。主播有真實頭像會比只有音頻播放量高十倍。

  通過虛擬主播幫助媒體融合轉型,在新聞時效性和跨語種傳播能力等方面再上臺階,實現(xiàn)了在不同場景下更為自然的人機交互,

  再次,虛擬客服,銀行傳統(tǒng)的真人窗口服務逐漸演變?yōu)楝F(xiàn)在的機器+遠程真人驗證服務,而用虛擬客服后,開戶、驗證都可以實現(xiàn),如有突發(fā)情況再真人參與,大大降低人力成本。

  最后,旅游領域的智能導游,傳統(tǒng)需要導游講解景點、歷史文化等。用機器替代真人實現(xiàn)智能導游,可以手機APP智能講解、簡單互動,如廁所、景點、餐館的地址查詢互動,也可以通過智能感應游客后音頻講解。

  未來智能虛擬人的引用可以實現(xiàn)自由對話,可以教我們學語言,也可以播新聞,更可以實時滿足人類的交互需求。

  可能引發(fā)犯罪問題?

  技術是把雙刃劍,能豐富和改變我們的生活,也能改變我們認知。技術在一方面的確可以幫助我們,但如果惡意使用,可能就會造成很大負面的影響,而智能虛擬人技術的發(fā)展應用也存在需要防范的問題。

20180622233_74228032(1).jpg

  AI技術已能達到構建完全虛擬的人物面孔和動物形態(tài),人工智能和神經(jīng)網(wǎng)絡技術可以用來輕易的虛構圖片和視頻使人們對此深信不疑,畢竟眼見為實嘛!小編擔心,如果工具被惡意利用,制造假新聞、惡作劇、電話詐騙等,如名人發(fā)布講話被篡改,合成語音的騷擾電話、詐騙電話時,我們又該怎么解決?

  答案就是聲紋識別,通過聲紋識別技術可以對視頻進行鑒定,去確定視頻中是否本人講話,甚至可以判斷出聲音是合成還是轉換的。而我們正規(guī)利用虛擬人時也可以通過技術的方式,將合成的視頻做標記,以防止被其他不法分子利用。

  小結

  虛擬人作為一個新興事物,其應用范圍的擴展、使用頻率的提高是一個必然的趨勢,伴隨著硬件技術與傳播理念的不斷演進,虛擬人在分類、潛在優(yōu)勢挖掘、跨媒體使用等方面將會大有長進,未來還將在娛樂、客服、醫(yī)療健康、教育、法律等多個領域提供個性化的內(nèi)容。終有一日,如同機器人必將走進我們的生活當中一樣,它會給我們現(xiàn)有的格局帶來一個全新的詮釋。

  以上部分內(nèi)容根據(jù)聲希科技聯(lián)合創(chuàng)始人孫立發(fā)博士在2019年人工智能技術峰會AI圖像與語音識別技術上的演講整理

參與評論
回復:
0/300
文明上網(wǎng)理性發(fā)言,評論區(qū)僅供其表達個人看法,并不表明a&s觀點。
0
關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗,提供媒體、活動、展會等整合營銷服務。

免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權所有 粵ICP備12072668號 粵公網(wǎng)安備 44030402000264號
用戶
反饋