為了更好地展開聲紋識別的技術應用,正如人臉識別技術的落地路徑一樣,聲紋識別也正在經(jīng)歷著技術產(chǎn)品化、平臺化和場景化應用的階段和流程。針對不同的應用場景,市場上相關聲紋識別產(chǎn)品已經(jīng)具備了一定規(guī)模和多樣性,包括終端和平臺型產(chǎn)品,比如各類專用的聲紋采集設備、聲紋鑒定軟件系統(tǒng)以及聲紋布控系統(tǒng)平臺等。
聲紋識別正在歷經(jīng)產(chǎn)品化、平臺化和場景化落地
聲紋的采集、識別、鑒定等環(huán)節(jié)同樣也是廠商核心技術的比拼環(huán)節(jié)。由于聲音不同于視頻圖像信息,它是動態(tài)的且無形的,那么,如何實現(xiàn)聲紋的采集和識別分析處理呢?此前筆者特別采訪了微納感知計算技術有限公司 CTO 王丹,據(jù)王丹表示,聲紋采集其實跟視頻圖像的采集是類似的方式,只不過視頻以幀為單位,而聲音是連續(xù)的。當然,復雜場景下的聲紋采集和識別分析依然存在一定挑戰(zhàn),首先要將聲音從復雜環(huán)境中清晰的采集下來,其次要分析聲音中所包含的信息內(nèi)容。
目前市場上的聲紋采集終端設備主要采用的是麥克風陣列,通過麥克風陣列信號處理技術實現(xiàn)高保真錄音、定向拾音、回聲消除、噪聲&混響抑制等,將聲音信息從復雜環(huán)境聲中清晰采集下來之后通過專業(yè)的聲紋鑒定系統(tǒng)完成聲紋的識別分析處理,助力公安、司法、金融、信貸、社保等行業(yè)的身份認證應用。
同時,隨著聲紋識別在安全防范領域應用的逐漸深入,一些專業(yè)的警用聲紋采集器、公安動態(tài)聲紋布控系統(tǒng)等也成為公安部門稽查布控,維護公共安全的有效技術手段,這也預示著聲紋識別相關產(chǎn)品已經(jīng)被納入到了公安部安全與警用電子產(chǎn)品的范圍。聲紋識別技術的加持,使得智慧安防建設增加了一個新的維度。
毋庸置疑,聲紋識別的市場潛力是可觀的。站在人工智能、生物識別這兩股強大的技術風口之上,前有人臉識別,聲紋識別市場也正延續(xù)著人臉識別的發(fā)展路徑,在算法涌現(xiàn)、平臺崛起和場景化落地的歷程中兀自發(fā)展和演進。這個過程也吸引著越來越多相關企業(yè)的入局,其中,擁有人工智能技術背景的企業(yè)成為聲紋識別賽道上的主要玩家。
像快商通、科大訊飛、SpeakIn、平安科技、遠鑒科技等這一批在聲紋識別領域已經(jīng)有一定技術沉淀的企業(yè),目前都已經(jīng)在相關領域開拓出了一片屬于自己的聲紋識別市場,也奠定了聲紋識別在各行業(yè)領域的應用基礎,但這也并不影響后來者在聲紋識別領域的躍躍欲試。
從人臉到聲紋,CV企業(yè)的AI技術版圖擴張
從近兩年在國際聲紋識別測試競賽中刷榜的企業(yè)還可以看出,一些原本專注于計算機視覺的AI企業(yè)也開始延伸了其人工智能技術研究觸角,從視覺領域跨越到聽覺領域,從人臉識別拓展到聲紋識別的技術研究,像依圖科技和澎思科技,都已經(jīng)圍繞著聲紋識別的算法和應用展開了相關布局,并積極推進聲紋識別技術和計算機視覺技術在已開拓領域的融合應用。
而計算機視覺領域的相關企業(yè)之所以朝機器聽覺領域延展,可以推測有幾方面的原因:
1)看好聲紋識別技術發(fā)展?jié)摿Γ瑩屜炔季帧?/strong>作為人工智能的技術分支之一,機器聽覺的技術應用市場潛力同樣巨大,既可以作為視覺AI身份認證核心技術的補充,同時又因為聲紋識別的獨特優(yōu)勢,可以拓展在更多細分場景的應用機會。越早著手聲紋識別的技術研究,將越有可能在未來技術應用爆發(fā)之際搶占市場先機;
2)依托計算機視覺方面的技術研究經(jīng)驗和市場資源,順勢進軍聲紋識別市場。盡管聲紋識別和人臉識別在技術方向上大不相同,但其實兩者在技術研究的方式上有很大的相似之處。現(xiàn)階段,無論是視覺AI還是聽覺AI的技術研究,仍然是以基于深度學習(DL, Deep Learning) 框架為主,在技術研究流程上基本都分為樣本采集、特征提取、特征建模、模型訓練等環(huán)節(jié)。對于計算機視覺企業(yè)而言,此前在人臉識別技術研究上所積累的經(jīng)驗可以為聲紋識別的技術研究奠定一定的經(jīng)驗基礎。
3)拓寬人工智能技術資源池,完善AI場景落地方案,提升產(chǎn)品服務質(zhì)量。涉足聲紋識別技術研究和應用,還有望為計算機視覺企業(yè)現(xiàn)階段已拓展的相關行業(yè)應用輸出人臉識別+聲紋識別的視聽AI技術方案組合,完善智能安防、AIoT等場景的應用需求,增強企業(yè)綜合競爭實力。
聲紋識別能否成長為下一個人臉識別市場?
盡管現(xiàn)階段,聲紋識別的市場體量遠不及人臉識別,據(jù)前瞻網(wǎng)《2018年生物識別技術行業(yè)發(fā)展現(xiàn)狀與市場趨勢分析》數(shù)據(jù)顯示,人臉識別和聲紋識別在整個生物識別市場的占比分別為16%和11%,而這還只是2018年的數(shù)據(jù)。
隨著AI技術的日趨成熟,人臉識別市場在這兩年迎來了遍地開花的發(fā)展態(tài)勢,而從相關市場動態(tài)來推測,聲紋識別作為視覺AI的補充,也正在諸多應用領域找到了落地應用的機會,這些勢必會推動聲紋識別市場體量的增長。當然,要實現(xiàn)大面積的落地應用,參考人臉識別的落地經(jīng)歷,聲紋識別也或?qū)⒚媾R聲紋庫建設、芯片升級、強化算法模型泛化能力、標準和非標場景的適用性等一系列的挑戰(zhàn)。聲紋識別能否成長為下一個人臉識別市場,我們靜待市場的自然發(fā)酵!
系列文章推薦:AI的B面,聲紋識別的應用優(yōu)勢和主要應用場景