中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

a&s專業(yè)的自動(dòng)化&安全生態(tài)服務(wù)平臺(tái)
公眾號(hào)
安全自動(dòng)化

安全自動(dòng)化

安防知識(shí)網(wǎng)

安防知識(shí)網(wǎng)

手機(jī)站
手機(jī)站

手機(jī)站

大安防供需平臺(tái)
大安防供需平臺(tái)

大安防供需平臺(tái)

資訊頻道橫幅A1
首頁 > 資訊 > 正文

語音識(shí)別的后半段路,從語言處理走向語言理解

在近二十年來,尤其是引入深度學(xué)習(xí)以后,語音識(shí)別取得了一系列重大突破,并一步步走向市場并搭載到終端產(chǎn)品中。然而在用戶體驗(yàn)上,魯棒性可以算得上這些產(chǎn)品最大的槽點(diǎn)之一,這也意味著語音識(shí)別的魯棒性問題已經(jīng)成為了該領(lǐng)域研究亟待解決的難點(diǎn)。
資訊頻道文章B

       文/IEEE Fellow、快商通首席科學(xué)家李海洲院士

  分享一:提高語音識(shí)別魯棒性的三種途徑

  近二十年,語音識(shí)別技術(shù)取得顯著進(jìn)步,但識(shí)別的魯棒性問題一直阻礙著語音技術(shù)的進(jìn)一步發(fā)展。對(duì)于語音識(shí)別和聲紋識(shí)別來說,該如何提升影響準(zhǔn)確率的系統(tǒng)魯棒性?快商通首席科學(xué)家李海洲教授表示,想要從根本上提升識(shí)別準(zhǔn)確率,可以從三個(gè)方面考慮。

  首先,專用系統(tǒng)轉(zhuǎn)換為通用系統(tǒng)。

  語音識(shí)別從實(shí)驗(yàn)室走向應(yīng)用,環(huán)境適應(yīng)性一直是不容忽視的問題。實(shí)驗(yàn)室中訓(xùn)練良好的引擎,一旦處于負(fù)責(zé)的噪聲環(huán)境,其識(shí)別準(zhǔn)確率便會(huì)急劇下降。這些噪聲主要來自于信道偏差,環(huán)境噪音,被污染的測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)的不匹配等。

  因此,想要提高識(shí)別準(zhǔn)確率,需將目前針對(duì)某單一環(huán)境的專用系統(tǒng)升級(jí)為通用系統(tǒng),提高識(shí)別引擎的自我學(xué)習(xí)能力,才能使其適應(yīng)不同環(huán)境的差異性。

  第二,擴(kuò)展獲取語音信息的渠道。

  假設(shè)三種場景:面對(duì)面交流、視頻交流、電話語音交流,人在哪種情況下能聽得最清楚?毫無疑問是面對(duì)面交流,這種場景下溝通,人們可以看到對(duì)方的表情、手勢,而這些信息也將輔助聽覺獲取更多的信息。

  人類從單一的渠道獲取信息尚且會(huì)有偏差的可能,機(jī)器亦然。李教授認(rèn)為,未來將會(huì)形成語音、視覺等多渠道的技術(shù)手段,來幫助語音識(shí)別和聲紋識(shí)別進(jìn)行準(zhǔn)確率的提升。

  第三,從語音語言處理走向語音語言理解。

  人們普遍認(rèn)為,語音識(shí)別是將聲音變?yōu)槲淖?。但在快商通首席科學(xué)家李海洲教授的理解里,語音識(shí)別的初衷是讓機(jī)器聽懂人類說話,并不一定需要將聲音轉(zhuǎn)化為文字。就像人與人之間的交流,并不需要先將對(duì)方說的語音轉(zhuǎn)換成文字。

  機(jī)器無法直接聽懂人類的語言,所以需要將語音轉(zhuǎn)為文字來輔助,但如果希望技術(shù)有更近一層的突破,我們需要將精力放于語音識(shí)別的后半段路——從語音語言處理走向語音語言理解。

  分享二:中國人工智能應(yīng)用落地的三大優(yōu)勢

  第四次工業(yè)革命即將來臨,世界各國已經(jīng)認(rèn)識(shí)到人工智能是未來國家之間競爭的關(guān)鍵賽場,因而紛紛爭奪這一輪科技革命的制高點(diǎn)。對(duì)于中國而言,人工智能的發(fā)展是一個(gè)歷史性的戰(zhàn)略機(jī)遇,政府創(chuàng)造土壤,企業(yè)奮起發(fā)力,中國在AI領(lǐng)域的實(shí)力與發(fā)展優(yōu)勢不斷被世界認(rèn)可。

  基于多年海外經(jīng)歷培養(yǎng)出的國際化視角,結(jié)合專業(yè)判斷能力,快商通首席科學(xué)家李海洲教授總結(jié)出中國人工智能應(yīng)用落地的三大優(yōu)勢。

  政府推動(dòng):在我國,人工智能連續(xù)三年被寫入總理政府工作報(bào)告,并成為促進(jìn)新興產(chǎn)業(yè)加快發(fā)展的新動(dòng)能。政府的推動(dòng)與總體規(guī)劃,完善了人工智能基礎(chǔ)設(shè)施的建設(shè),并使得各科技企業(yè)的技術(shù)能夠穩(wěn)步落地。

  數(shù)據(jù)優(yōu)勢:人工智能的發(fā)展需要與深度學(xué)習(xí)和大數(shù)據(jù)緊密結(jié)合,中國在數(shù)據(jù)資源這一方面的優(yōu)勢,是毋庸置疑的。僅僅在日常生活中,中國近14億的人口就能產(chǎn)生比全球其他國家更多的數(shù)據(jù)。這讓深度學(xué)習(xí)有一個(gè)用武之地。

  企業(yè)環(huán)境:自2012年深度學(xué)習(xí)取得重大突破,中國人工智能企業(yè)如雨后春筍般生長,激烈的競爭環(huán)境下,企業(yè)家們必須兼具創(chuàng)新與奮斗精神,才能在大浪淘沙中適者生存。再這樣的情況下,中國人工智能技術(shù)的創(chuàng)業(yè)環(huán)境積極向上,為優(yōu)質(zhì)的技術(shù)和企業(yè)家創(chuàng)造了健康的創(chuàng)業(yè)土壤。


參與評(píng)論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評(píng)論區(qū)僅供其表達(dá)個(gè)人看法,并不表明a&s觀點(diǎn)。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺(tái),自1994年品牌成立以來,一直專注于安全&自動(dòng)化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會(huì)資源以及豐富的媒體經(jīng)驗(yàn),提供媒體、活動(dòng)、展會(huì)等整合營銷服務(wù)。

免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號(hào) 粵公網(wǎng)安備 44030402000264號(hào)
用戶
反饋