近日,機(jī)器聽覺解決方案供應(yīng)商大象聲科(Elevoc)宣布獲得小米和高通創(chuàng)投的數(shù)千萬人民幣的Pre-A輪戰(zhàn)略投資。摯金資本擔(dān)任本輪融資的獨(dú)家財務(wù)顧問。大象聲科表示,該輪融資具有廣泛重要的戰(zhàn)略意義,將有利于強(qiáng)化上下游產(chǎn)業(yè)鏈,進(jìn)一步賦能通訊、智能家居、智能車載、可穿戴設(shè)備、安防等行業(yè)客戶。
大象聲科是一家語音信號處理引擎提供商,2015年創(chuàng)立于美國硅谷,目前總部位于深圳。公司匯聚了以俄亥俄州立大學(xué)國際著名學(xué)者、IEEE Fellow汪德亮教授為代表的人工智能語音交互領(lǐng)域優(yōu)秀的科學(xué)家團(tuán)隊,依托算法、軟件、硬件三個維度的技術(shù)縱深,為語音增強(qiáng)和智能語音交互提供解決方案。
語音增強(qiáng)技術(shù),深度學(xué)習(xí)驅(qū)動
語音增強(qiáng),本質(zhì)就是語音降噪。在收錄聲音時,往往被嘈雜的環(huán)境背景聲所“污染”,語音增強(qiáng)可以從噪音中提取有效的聲音信號,恢復(fù)“干凈”的語音。
語音增強(qiáng)涉及的應(yīng)用領(lǐng)域非常廣泛,包括語音通話、電話會議、現(xiàn)場錄音、軍事通信、助聽器設(shè)備和語音識別設(shè)備等,并成為許多語音編碼和識別系統(tǒng)的預(yù)處理模塊。
提到語音增強(qiáng)技術(shù),就不得不提出計算機(jī)語音識別領(lǐng)域注明的“雞尾酒會問題”。“雞尾酒會問題”指在如雞尾酒會嘈雜的環(huán)境下的強(qiáng)干擾下,辨識出一種聲音難度是很高的,語音識別率極低。如何在混合信號中識別出每個人的獨(dú)立信號成了技術(shù)難題。
深度學(xué)習(xí)語音增強(qiáng)技術(shù)是該領(lǐng)域的新起之秀,卻有攻入破竹之勢。不同于主流而傳統(tǒng)的數(shù)字信號處理方法,它借鑒機(jī)器學(xué)習(xí)的思路,通過有監(jiān)督的訓(xùn)練實(shí)現(xiàn)語音增強(qiáng),可以解決瞬時降噪等技術(shù)難題。華為今年發(fā)布的mate10手機(jī),已成功地將該技術(shù)應(yīng)用到了復(fù)雜聲學(xué)環(huán)境中的語音通話中。而今年4月,刷遍朋友圈的錘子手機(jī)新品堅果3采用的AI語音降噪技術(shù),就是來自大象聲科的深度學(xué)習(xí)語音提取技術(shù)。
目前,大象聲科已經(jīng)成功推出了全球首款芯片級單通道人工智能語音增強(qiáng)方案,在不依賴物理硬件的情況下,有效實(shí)現(xiàn)了噪音和人聲的分離,并在手機(jī)通訊行業(yè)率先進(jìn)行了商用,開啟了人類無噪音通訊時代。此外,大象聲科將單通道語音增強(qiáng)技術(shù)與麥克風(fēng)陣列結(jié)合,將多通道語音增強(qiáng)的性能也提升到新臺階,真正解決了語音前端處理的技術(shù)難點(diǎn)。應(yīng)用場景有智能手機(jī)、對講機(jī)、耳機(jī)、麥克風(fēng)、在線教育平臺、網(wǎng)絡(luò)視頻會議、語音客服等。
為機(jī)器人打造智能耳朵的生意,資本看好
小米首席架構(gòu)師、人工智能與云平臺副總裁崔寶秋表示:“智能語音已經(jīng)成了新一代人機(jī)交互入口的必爭之地,鑒于AI在語音以及其他領(lǐng)域的深度應(yīng)用,我們將AI定為小米未來十年最重要的戰(zhàn)略之一。 大象聲科的技術(shù)團(tuán)隊基于多年對計算聽覺場景分析的研究和積累,創(chuàng)造性地采用深度學(xué)習(xí)技術(shù)解決聽覺領(lǐng)域中著名的「雞尾酒會問題」,擁有全球領(lǐng)先的核心算法。我相信小米與大象聲科的合作,一定會為小米以及小米生態(tài)鏈下一代系列智能語音產(chǎn)品帶來更精彩的人機(jī)交互體驗?!?/p>
高通全球副總裁兼高通創(chuàng)投董事總經(jīng)理沈勁表示,“人工智能正在從云端向終端遷移,高通作為技術(shù)提供商,一直在積極地關(guān)注并加速在終端側(cè)人工智能的布局,大象聲科擁有業(yè)界領(lǐng)先的語音增強(qiáng)和智能語音交互解決方案,勢必會讓更多的終端設(shè)備受益于人工智能技術(shù),加快終端智能化生態(tài)的發(fā)展?!?/p>
大象聲科創(chuàng)始人兼CEO苗健彰表示:“ 雖然人工智能技術(shù)的發(fā)展已經(jīng)取得了長足進(jìn)步,但是要實(shí)現(xiàn)人性化的的語音交互還有許多關(guān)鍵問題有待解決,機(jī)器聽覺就是其中之一。自創(chuàng)立伊始,大象聲科便樹立了為機(jī)器人打造智能耳朵的目標(biāo)。大象聲科在機(jī)器聽覺理論研究上一直走在世界前沿,聯(lián)合創(chuàng)始人汪德亮教授和張學(xué)良教授在該領(lǐng)域有超過20年的技術(shù)積累。特別是汪教授不僅是機(jī)器聽覺領(lǐng)域的重要理論——計算聽覺場景分析(CASA)的奠基人之一,還是全球第一位將深度學(xué)習(xí)應(yīng)用于語音增強(qiáng)的學(xué)界泰斗。”
下一步,大象聲科將依托自身行業(yè)領(lǐng)先的技術(shù)優(yōu)勢,整合小米和高通創(chuàng)投的戰(zhàn)略資源,聯(lián)合通訊、智能硬件、安防等領(lǐng)域的優(yōu)質(zhì)客戶,共同將高品質(zhì)和便利的人工智能服務(wù)帶進(jìn)千家萬戶。
據(jù)了解,2018年中國智能硬件市場規(guī)模預(yù)計將突破4000億元,全球語音產(chǎn)業(yè)規(guī)模預(yù)計也將突破100億美元,語音產(chǎn)業(yè)結(jié)構(gòu)將順延硬件產(chǎn)品、AI軟件、語音應(yīng)用Apps、生態(tài)系統(tǒng)服務(wù)相結(jié)合的架構(gòu)繼續(xù)高速發(fā)展。語音交互將成為主流的人機(jī)交互方式之一,音訊處理的需求也將快速擴(kuò)張。