中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

a&s專業(yè)的自動(dòng)化&安全生態(tài)服務(wù)平臺(tái)
公眾號(hào)
安全自動(dòng)化

安全自動(dòng)化

安防知識(shí)網(wǎng)

安防知識(shí)網(wǎng)

手機(jī)站
手機(jī)站

手機(jī)站

大安防供需平臺(tái)
大安防供需平臺(tái)

大安防供需平臺(tái)

資訊頻道橫幅A1
首頁(yè) > 資訊 > 正文

直擊智能語(yǔ)音痛點(diǎn) 如何打造完美人機(jī)交互?

人機(jī)交互的真正意義是讓智能硬件能夠進(jìn)行自動(dòng)化的服務(wù)并與用戶進(jìn)行自然交互,實(shí)現(xiàn)完美的用戶體驗(yàn)。
資訊頻道文章B

  國(guó)家《信息產(chǎn)業(yè)科技發(fā)展“十一五”規(guī)劃和2020年中長(zhǎng)期規(guī)劃綱要》指出要落實(shí)“中文信息處理和智能人機(jī)交互技術(shù)”。人機(jī)交互的真正意義是讓智能硬件能夠進(jìn)行自動(dòng)化的服務(wù)并與用戶進(jìn)行自然交互,實(shí)現(xiàn)完美的用戶體驗(yàn),這要求智能硬件能夠結(jié)合大數(shù)據(jù)進(jìn)行分析并深度學(xué)習(xí),實(shí)現(xiàn)行為理解并執(zhí)行操作。當(dāng)前,我國(guó)智能人機(jī)交互技術(shù)起步不久,相關(guān)市場(chǎng)也處于上升階段,尤其是智能硬件市場(chǎng)備受關(guān)注,該領(lǐng)域內(nèi)的多模態(tài)人機(jī)交互技術(shù)得到了廣泛的應(yīng)用,例如智能語(yǔ)音技術(shù)、虹膜識(shí)別技術(shù)、體感觸覺(jué)技術(shù)等等。


思必馳信息科技有限公司市場(chǎng)總監(jiān) 龍夢(mèng)竹

  在智能語(yǔ)音技術(shù)方面,就國(guó)際市場(chǎng)而言,已經(jīng)形成了Nuance、谷歌、蘋果、微軟等IT巨頭的壟斷格局。在國(guó)內(nèi)市場(chǎng),科大訊飛、百度、思必馳等智能語(yǔ)音解決方案各顯其色,實(shí)現(xiàn)了較好的中文語(yǔ)音信息處理技術(shù)。

  但是,當(dāng)前國(guó)內(nèi)的智能語(yǔ)音技術(shù)在人機(jī)交互方面仍舊存在很大提升空間,主要表現(xiàn)為:

  智能硬件“聽(tīng)不懂”

  出現(xiàn)該問(wèn)題的原因無(wú)非是“沒(méi)聽(tīng)清”和“不理解”。“沒(méi)聽(tīng)清”是語(yǔ)音識(shí)別出現(xiàn)了問(wèn)題,噪聲環(huán)境、識(shí)別距離、硬件回聲等均是識(shí)別的關(guān)鍵因素,處理不當(dāng)便會(huì)導(dǎo)致識(shí)別率降低;“不理解”是由于語(yǔ)義理解不夠深入而導(dǎo)致,說(shuō)話人不同,講話習(xí)慣、音調(diào)、音速等也各不相同,上下文語(yǔ)境千差萬(wàn)別的情況下,如果不能結(jié)合語(yǔ)境進(jìn)行深度學(xué)習(xí),語(yǔ)義理解也將差強(qiáng)人意,更談不上能夠進(jìn)行多輪交互了。

  智能硬件“不聰明”

  智能硬件“不聰明”表現(xiàn)為:無(wú)法根據(jù)要求提供相應(yīng)的信息,定制功能缺失。無(wú)論是智能語(yǔ)音,還是人臉識(shí)別、圖像識(shí)別等技術(shù),都只是實(shí)現(xiàn)人機(jī)交互的手段和工具,人類真正的交互對(duì)象是資源。當(dāng)前人機(jī)交互存在的很大問(wèn)題是資源不足,不能滿足人們多樣的功能需求,如電話、社交、音樂(lè)、電臺(tái)、導(dǎo)航、地圖、天氣查詢、票務(wù)查詢等等,智能硬件顯得很不智能。當(dāng)前智能硬件的后端服務(wù)集成尚未能滿足當(dāng)前用戶的需要。

  針對(duì)智能硬件“聽(tīng)不懂”的問(wèn)題,亟待解決的是語(yǔ)音識(shí)別和語(yǔ)義理解問(wèn)題。在語(yǔ)音識(shí)別方面,角度、距離、回聲、噪聲等因素均對(duì)識(shí)別效果產(chǎn)生極大的影響。確定合適的拾音角度和拾音范圍距離,有效降噪和消除回聲,進(jìn)行準(zhǔn)確的聲源定位,是識(shí)別的關(guān)鍵一步。當(dāng)前國(guó)內(nèi)市場(chǎng)很多企業(yè)已經(jīng)陸續(xù)推出了相應(yīng)的解決方案,例如 5麥麥克風(fēng)陣列,可進(jìn)行快速集成,但是成本稍高,適合小批量產(chǎn)品。中國(guó)科學(xué)院聲學(xué)所的8麥技術(shù)方案,針對(duì)會(huì)議系統(tǒng),且目前的市場(chǎng)應(yīng)用并不廣泛。另一方面還有環(huán)形“6+1”麥克風(fēng)陣列,可進(jìn)行360°無(wú)死角拾音,準(zhǔn)確進(jìn)行聲源定位,并采用獨(dú)有算法的降噪和回聲消除技術(shù),有效克服了語(yǔ)音識(shí)別過(guò)程中,隨著語(yǔ)音傳播距離加大,因語(yǔ)音本身的衰減,混響、背景噪音、人聲干擾和回聲加大等技術(shù)難點(diǎn)帶來(lái)的阻力,實(shí)現(xiàn)業(yè)內(nèi)領(lǐng)先的遠(yuǎn)場(chǎng)5米交互識(shí)別率92%以上,識(shí)別和交互效果媲美近講。由此可見(jiàn),當(dāng)下語(yǔ)音技術(shù)企業(yè)均從科技研發(fā)角度出發(fā),從解決實(shí)際應(yīng)用場(chǎng)景下的產(chǎn)品需求出發(fā),著力解決語(yǔ)音識(shí)別和交互的這一大問(wèn)題。

  智能語(yǔ)音如何推動(dòng)人機(jī)交互

  語(yǔ)義理解的關(guān)鍵是結(jié)合上下文語(yǔ)境進(jìn)行深度學(xué)習(xí),然而,在真實(shí)場(chǎng)景下,傳統(tǒng)語(yǔ)音識(shí)別加自然語(yǔ)言處理的方案并不能很好地實(shí)現(xiàn)自由的“人機(jī)交互”。微軟研究院表示,基于上下文的理解是微軟自然語(yǔ)言處理組正在解決的重點(diǎn)問(wèn)題,Cortana助手中就初步實(shí)現(xiàn)了上下文語(yǔ)義理解??拼笥嶏w也在年度發(fā)布會(huì)上表示,“糾正、打斷”是自然交互的本質(zhì)要求,且糾錯(cuò)是人機(jī)語(yǔ)音交互的一個(gè)標(biāo)準(zhǔn),其對(duì)話系統(tǒng)也已經(jīng)實(shí)現(xiàn)基于上下文的理解。我認(rèn)為基于上下文的理解是認(rèn)知智能的主要表現(xiàn)之一,也是解決語(yǔ)音識(shí)別錯(cuò)誤的最有效途徑之一,業(yè)界也已經(jīng)誕生了“支持打斷和智能糾正”的認(rèn)知型對(duì)話系統(tǒng)及相關(guān)場(chǎng)景解決方案。

  人機(jī)交互的另一端是資源,豐富的第三方服務(wù)內(nèi)容可使智能硬件變得更聰明,匯集大量的資源功能才能有效提升后端服務(wù)質(zhì)量。所謂的智能語(yǔ)音解決方案,應(yīng)該能夠支持安卓、linux、QNX等主流操作系統(tǒng),集成了豐富的第三方服務(wù)資源,例如微信、高德地圖、酷我音樂(lè)、蝦米音樂(lè)、喜馬拉雅FM、考拉電臺(tái)、神馬搜索、大眾點(diǎn)評(píng)、墨跡天氣、百度天氣、攜程、百度股票等等,為用戶提供社交、周邊搜索、導(dǎo)航、音樂(lè)電臺(tái)、天氣日歷等多功能服務(wù)。豐富的第三方服務(wù)資源供智能硬件隨時(shí)交互提取使用,智能硬件變得更聰明智能,人機(jī)交互才能變得更流暢完美。

  智能語(yǔ)音的不斷發(fā)展也在推動(dòng)著人機(jī)交互的不斷進(jìn)步,拋棄傳統(tǒng)APP/遙控器等移動(dòng)終端的控制,實(shí)現(xiàn)全語(yǔ)音自動(dòng)操控,智能硬件也能越來(lái)越琢磨透人類的思想,追蹤行動(dòng)意圖,這些種種,均促使人們的生活更加智能便捷。智能語(yǔ)音的痛點(diǎn)始終放緩了人機(jī)交互的步伐,解決識(shí)別、理解與后端服務(wù)的難題,將促進(jìn)人機(jī)交互向前邁出大大的一步,智能人機(jī)交互的未來(lái)需要我們共同努力。

參與評(píng)論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評(píng)論區(qū)僅供其表達(dá)個(gè)人看法,并不表明a&s觀點(diǎn)。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺(tái),自1994年品牌成立以來(lái),一直專注于安全&自動(dòng)化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場(chǎng)趨勢(shì)的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國(guó)際行業(yè)展覽會(huì)資源以及豐富的媒體經(jīng)驗(yàn),提供媒體、活動(dòng)、展會(huì)等整合營(yíng)銷服務(wù)。

免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號(hào) 粵公網(wǎng)安備 44030402000264號(hào)
用戶
反饋