文/IEEE Fellow、快商通首席科學(xué)家李海洲院士
分享一:提高語音識(shí)別魯棒性的三種途徑
近二十年,語音識(shí)別技術(shù)取得顯著進(jìn)步,但識(shí)別的魯棒性問題一直阻礙著語音技術(shù)的進(jìn)一步發(fā)展。對(duì)于語音識(shí)別和聲紋識(shí)別來說,該如何提升影響準(zhǔn)確率的系統(tǒng)魯棒性?快商通首席科學(xué)家李海洲教授表示,想要從根本上提升識(shí)別準(zhǔn)確率,可以從三個(gè)方面考慮。
首先,專用系統(tǒng)轉(zhuǎn)換為通用系統(tǒng)。
語音識(shí)別從實(shí)驗(yàn)室走向應(yīng)用,環(huán)境適應(yīng)性一直是不容忽視的問題。實(shí)驗(yàn)室中訓(xùn)練良好的引擎,一旦處于負(fù)責(zé)的噪聲環(huán)境,其識(shí)別準(zhǔn)確率便會(huì)急劇下降。這些噪聲主要來自于信道偏差,環(huán)境噪音,被污染的測試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)的不匹配等。
因此,想要提高識(shí)別準(zhǔn)確率,需將目前針對(duì)某單一環(huán)境的專用系統(tǒng)升級(jí)為通用系統(tǒng),提高識(shí)別引擎的自我學(xué)習(xí)能力,才能使其適應(yīng)不同環(huán)境的差異性。
第二,擴(kuò)展獲取語音信息的渠道。
假設(shè)三種場景:面對(duì)面交流、視頻交流、電話語音交流,人在哪種情況下能聽得最清楚?毫無疑問是面對(duì)面交流,這種場景下溝通,人們可以看到對(duì)方的表情、手勢,而這些信息也將輔助聽覺獲取更多的信息。
人類從單一的渠道獲取信息尚且會(huì)有偏差的可能,機(jī)器亦然。李教授認(rèn)為,未來將會(huì)形成語音、視覺等多渠道的技術(shù)手段,來幫助語音識(shí)別和聲紋識(shí)別進(jìn)行準(zhǔn)確率的提升。
第三,從語音語言處理走向語音語言理解。
人們普遍認(rèn)為,語音識(shí)別是將聲音變?yōu)槲淖?。但在快商通首席科學(xué)家李海洲教授的理解里,語音識(shí)別的初衷是讓機(jī)器聽懂人類說話,并不一定需要將聲音轉(zhuǎn)化為文字。就像人與人之間的交流,并不需要先將對(duì)方說的語音轉(zhuǎn)換成文字。
機(jī)器無法直接聽懂人類的語言,所以需要將語音轉(zhuǎn)為文字來輔助,但如果希望技術(shù)有更近一層的突破,我們需要將精力放于語音識(shí)別的后半段路——從語音語言處理走向語音語言理解。
分享二:中國人工智能應(yīng)用落地的三大優(yōu)勢
第四次工業(yè)革命即將來臨,世界各國已經(jīng)認(rèn)識(shí)到人工智能是未來國家之間競爭的關(guān)鍵賽場,因而紛紛爭奪這一輪科技革命的制高點(diǎn)。對(duì)于中國而言,人工智能的發(fā)展是一個(gè)歷史性的戰(zhàn)略機(jī)遇,政府創(chuàng)造土壤,企業(yè)奮起發(fā)力,中國在AI領(lǐng)域的實(shí)力與發(fā)展優(yōu)勢不斷被世界認(rèn)可。
基于多年海外經(jīng)歷培養(yǎng)出的國際化視角,結(jié)合專業(yè)判斷能力,快商通首席科學(xué)家李海洲教授總結(jié)出中國人工智能應(yīng)用落地的三大優(yōu)勢。
政府推動(dòng):在我國,人工智能連續(xù)三年被寫入總理政府工作報(bào)告,并成為促進(jìn)新興產(chǎn)業(yè)加快發(fā)展的新動(dòng)能。政府的推動(dòng)與總體規(guī)劃,完善了人工智能基礎(chǔ)設(shè)施的建設(shè),并使得各科技企業(yè)的技術(shù)能夠穩(wěn)步落地。
數(shù)據(jù)優(yōu)勢:人工智能的發(fā)展需要與深度學(xué)習(xí)和大數(shù)據(jù)緊密結(jié)合,中國在數(shù)據(jù)資源這一方面的優(yōu)勢,是毋庸置疑的。僅僅在日常生活中,中國近14億的人口就能產(chǎn)生比全球其他國家更多的數(shù)據(jù)。這讓深度學(xué)習(xí)有一個(gè)用武之地。
企業(yè)環(huán)境:自2012年深度學(xué)習(xí)取得重大突破,中國人工智能企業(yè)如雨后春筍般生長,激烈的競爭環(huán)境下,企業(yè)家們必須兼具創(chuàng)新與奮斗精神,才能在大浪淘沙中適者生存。再這樣的情況下,中國人工智能技術(shù)的創(chuàng)業(yè)環(huán)境積極向上,為優(yōu)質(zhì)的技術(shù)和企業(yè)家創(chuàng)造了健康的創(chuàng)業(yè)土壤。