思必馳于業(yè)內(nèi)率先推出多輪對(duì)話、可糾正可打斷的認(rèn)知智能、實(shí)時(shí)轉(zhuǎn)錄的語音輸入板、環(huán)形6+1遠(yuǎn)場(chǎng)麥克風(fēng)陣列、AIOS-思必馳對(duì)話操作系統(tǒng),是國內(nèi)唯一擁有人機(jī)對(duì)話技術(shù),國際上極少數(shù)擁有自主產(chǎn)權(quán)、中英文綜合語音技術(shù)(語音識(shí)別、語音合成、自然語言理解、聲紋識(shí)別、性別及年齡識(shí)別、情緒識(shí)別等)的公司之一。
“環(huán)形六麥陣列”人性化的語音交互技術(shù)
環(huán)形六麥陣列是在“環(huán)形6+1遠(yuǎn)場(chǎng)麥克風(fēng)陣列”基礎(chǔ)上全面升級(jí)的一項(xiàng)語音交互技術(shù)。主要針對(duì)智能家居和智能機(jī)器人提出的軟硬一體化解決方案。支持回聲消除、聲源定位、波束成形、語音增強(qiáng)等功能。同時(shí),思必馳提供云端第三方內(nèi)容服務(wù),讓大數(shù)據(jù)精準(zhǔn)服務(wù)于智能語音領(lǐng)域。
1、語音增強(qiáng):
解決噪聲環(huán)境下的識(shí)別問題需要從抑制噪聲和語音增強(qiáng)兩方面入手。思必馳環(huán)形六麥陣列利用拾音波束成形,采用獨(dú)特算法,有效抑制波束之外的噪聲,同時(shí)融合語音信號(hào)的空時(shí)信息,從含噪聲的語音信號(hào)中提取出純凈語音,有效地增強(qiáng)說話人語音。
2、聲源定位:
思必馳環(huán)形六麥陣列實(shí)現(xiàn)360°環(huán)形拾音,多麥定向,準(zhǔn)確計(jì)算目標(biāo)說話人的角度和距離,實(shí)現(xiàn)對(duì)目標(biāo)說話人的跟蹤以及語音定向拾取,精準(zhǔn)度控制在±10°以內(nèi)。聲源定位功能不限制說話人運(yùn)動(dòng),不需要移位操作,這增強(qiáng)了產(chǎn)品設(shè)計(jì)的靈活性和功能的多樣性,可有效地實(shí)現(xiàn)對(duì)產(chǎn)品的多功能輔助作用。
3、遠(yuǎn)場(chǎng)交互:
思必馳環(huán)形六麥陣列在前端充分利用其空域?yàn)V波特性,抑制拾音波束外的回聲、混響等噪聲,進(jìn)行語音增強(qiáng)處理,輔之以語音識(shí)別引擎的二次處理,實(shí)現(xiàn)優(yōu)質(zhì)的遠(yuǎn)場(chǎng)識(shí)別交互。思必馳已實(shí)現(xiàn)了國內(nèi)領(lǐng)先的5米遠(yuǎn)場(chǎng)交互,5米、3米、1米識(shí)別率分別為92%, 94%, 96%以上,遠(yuǎn)場(chǎng)識(shí)別媲美近講。
4、打斷糾錯(cuò):
思必馳環(huán)形六麥陣列融入了自適應(yīng)、理解糾錯(cuò)、智能反饋等認(rèn)知技術(shù),重新提取大數(shù)據(jù)因素,并進(jìn)行二次計(jì)算,實(shí)現(xiàn)智能糾正打斷,能夠適應(yīng)更多的應(yīng)用環(huán)境,具有進(jìn)化調(diào)整功能,從而在人機(jī)交互的過程中,使機(jī)器更“聽話”。
5、多輪對(duì)話:
基于對(duì)話邏輯,允許人機(jī)進(jìn)行多輪語音互動(dòng),讓機(jī)器理解用戶的深層意圖并提供反饋。而機(jī)器可以通過深度學(xué)習(xí),可以根據(jù)上下文語境準(zhǔn)確追蹤用戶意圖,并隨著數(shù)據(jù)的積累而越發(fā)靈活精準(zhǔn)流暢。
6、后端服務(wù):
目前思必馳環(huán)形六麥陣列解決方案整合了高德地圖、酷我音樂、蝦米音樂、喜馬拉雅電臺(tái)、考拉電臺(tái)、大眾點(diǎn)評(píng)等生活服務(wù)方面的諸多關(guān)鍵資源,致力將智能語音服務(wù)整合成一體化產(chǎn)品,打造體驗(yàn)閉環(huán),形成完整的生態(tài)鏈。
環(huán)形六麥陣列推動(dòng)了智能機(jī)器人、智能家居等領(lǐng)域便捷化的發(fā)展,淘汰按鍵、遙控器、APP等控制終端,實(shí)現(xiàn)純語音控制的未來便捷生活。促進(jìn)了智能語音交互技術(shù)的發(fā)展,有利于未來智能人機(jī)交互的多模態(tài)結(jié)合和人工智能整個(gè)行業(yè)的發(fā)展。