中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

a&s專(zhuān)業(yè)的自動(dòng)化&安全生態(tài)服務(wù)平臺(tái)
公眾號(hào)
安全自動(dòng)化

安全自動(dòng)化

安防知識(shí)網(wǎng)

安防知識(shí)網(wǎng)

手機(jī)站
手機(jī)站

手機(jī)站

大安防供需平臺(tái)
大安防供需平臺(tái)

大安防供需平臺(tái)

資訊頻道橫幅A1
首頁(yè) > 資訊 > 正文

聲音識(shí)別及其在安防等方面的應(yīng)用

資訊頻道文章B

讓機(jī)器聽(tīng)懂人類(lèi)的語(yǔ)音,這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。聲音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解,把聲音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令而識(shí)別出人的身份的高技術(shù)。本文論述聲音識(shí)別系統(tǒng)的組成、原理、類(lèi)型、優(yōu)缺點(diǎn)、及制約其發(fā)展的關(guān)鍵,以及在安防等方面的應(yīng)用等。

大家知道,在現(xiàn)代的信息社會(huì)里,信息的載體有語(yǔ)言文字、聲音、圖像以及影視等等。但信息的主要載體是語(yǔ)言及文字,它傳遞的信息占全部信息量的80%以上。因此應(yīng)用計(jì)算機(jī)對(duì)語(yǔ)言文字進(jìn)行處理,以更充分地利用信息資源具有十分重要的意義。由于語(yǔ)言現(xiàn)象所特有的多樣性、不確定性和模糊性,語(yǔ)言信息處理,特別是自然語(yǔ)言的識(shí)別、理解和生成的研究,一直是而且至今還是最具有挑戰(zhàn)性的一個(gè)學(xué)術(shù)領(lǐng)域,因而對(duì)聲音識(shí)別技術(shù)的研究,具有重要的學(xué)術(shù)意義與社會(huì)意義。

聲音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解把聲音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。構(gòu)成聲音的獨(dú)特性原因與發(fā)聲的生理原因有關(guān)。人的語(yǔ)言產(chǎn)生是人體語(yǔ)言中樞與發(fā)音器官之間一個(gè)復(fù)雜的生理物理過(guò)程,身體在講話(huà)時(shí)使用的器官,如舌、牙齒、喉頭、肺、鼻腔等,在尺寸和形態(tài)方面每個(gè)人的差異很大,所以任何兩個(gè)人的聲紋圖譜都有差異。所謂聲紋,就是用電聲學(xué)儀器顯示的攜帶言語(yǔ)信息的聲波頻譜。發(fā)聲的原動(dòng)力是呼吸產(chǎn)生的氣流,我們說(shuō)話(huà)時(shí)用從肺呼出來(lái)的氣流,經(jīng)過(guò)支氣管、氣管后,在喉下的聲腔增加壓力,沖出聲門(mén),再由喉、鼻共鳴,并由舌、齒、唇等的位置和形狀的變化改變音調(diào)。

此外,每個(gè)人的發(fā)音器官發(fā)出的清晰聲音并非天生,而是經(jīng)由不斷學(xué)習(xí)改變錯(cuò)誤而形成。兩人以同樣方式運(yùn)用其發(fā)音器官是微乎其微的,因此每個(gè)人發(fā)出聲音各不相同,即使是克隆人也會(huì)有所不同。

每個(gè)人的語(yǔ)音聲學(xué)特征既有相對(duì)穩(wěn)定性,又有變異性,不是絕對(duì)的、一成不變的。這種變異可來(lái)自生理、病理、心理、模擬、偽裝,也與環(huán)境干擾有關(guān)。盡管如此,在一般情況下,聲紋的鑒定仍能區(qū)別不同的人或法定是同一人的聲音,從而可以進(jìn)行個(gè)人的身份識(shí)別。

語(yǔ)音是最方便、快捷、自然的人際交流手段,采用語(yǔ)音作為人與計(jì)算機(jī)交互的手段,使計(jì)算機(jī)能像人一樣,具有聽(tīng)、說(shuō)和理解能力,這是人們長(zhǎng)期以來(lái)夢(mèng)寐以求的事情。近二十年來(lái),聲音識(shí)別技術(shù)取得顯著進(jìn)步,開(kāi)始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來(lái)10年內(nèi),聲音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、安全防范、汽車(chē)電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。很多專(zhuān)家都認(rèn)為聲音識(shí)別技術(shù)是21世紀(jì)前10年將對(duì)人類(lèi)生活方式產(chǎn)生重大影響的十大重要的科技發(fā)展技術(shù)之一。

下面介紹聲音識(shí)別系統(tǒng)的組成、原理、類(lèi)型、優(yōu)缺點(diǎn)、制約其發(fā)展的關(guān)鍵,聲音識(shí)別在國(guó)內(nèi)與我所取得的成果以及在安防等方面的應(yīng)用等。

聲音識(shí)別系統(tǒng)的組成、原理及類(lèi)型
組成與工作原理
聲音拾取設(shè)備(即麥克風(fēng))不斷地采集聲音信號(hào),聲音識(shí)別設(shè)備不斷地測(cè)量、記錄聲音的波形和變化。實(shí)際上,聲音識(shí)別主要是基于將現(xiàn)場(chǎng)采集到的聲音同登記過(guò)的聲音模板進(jìn)行精確的匹配。

人的聲音首先通過(guò)拾音器(即麥克風(fēng))拾取,特征參數(shù)提取單元檢索出表現(xiàn)聲音信號(hào)的聲學(xué)特殊參數(shù),經(jīng)計(jì)算機(jī)聲學(xué)模型的處理,使之成為與聲音數(shù)據(jù)厙所貯存的聲紋圖譜相同的模式,然后用新采集的與貯存的聲音模板進(jìn)行對(duì)比識(shí)別,最后輸出識(shí)別的結(jié)果。 [nextpage]

一個(gè)聲音識(shí)別系統(tǒng)需要很多單元組成,但硬件設(shè)備實(shí)際只有麥克風(fēng)與計(jì)算機(jī)兩部分。因?yàn)槁曇糇R(shí)別主要是計(jì)算機(jī)或者程序,接受和解釋口述或者理解并執(zhí)行語(yǔ)音命令的能力。對(duì)于計(jì)算機(jī)的使用,模擬音頻必須轉(zhuǎn)換成數(shù)字信號(hào)。這要求進(jìn)行模擬數(shù)字轉(zhuǎn)換。用計(jì)算機(jī)解釋信號(hào),它必須要有一個(gè)數(shù)字?jǐn)?shù)據(jù)庫(kù)或者詞典,并拿它來(lái)與收到的信號(hào)作比較。語(yǔ)音元素存在硬盤(pán)上并在程序運(yùn)行的時(shí)候被加載到內(nèi)存里。比較程序?qū)z測(cè)存儲(chǔ)的元素和來(lái)自A/D轉(zhuǎn)換器的信號(hào)。

用計(jì)算機(jī)進(jìn)行聲音識(shí)別也是一個(gè)模式識(shí)別匹配的過(guò)程。在這個(gè)過(guò)程中,計(jì)算機(jī)首先要根據(jù)人的聲音特點(diǎn)建立聲音模型,對(duì)輸入的聲音信號(hào)進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立聲音識(shí)別所需的模板。而計(jì)算機(jī)在識(shí)別過(guò)程中要根據(jù)聲音識(shí)別的整體模型,將計(jì)算機(jī)中存放的聲音模板與輸入的聲音信號(hào)的特征進(jìn)行比較,根據(jù)一定的搜索和匹配策略,找出一系列最優(yōu)的與輸入的聲音匹配的模板。然后,據(jù)此模板的定義,通過(guò)查表就可以給出計(jì)算機(jī)的識(shí)別結(jié)果。顯然,這種最優(yōu)的結(jié)果與特征的選擇、聲音模型及其好壞、模板是否準(zhǔn)確等都有直接的關(guān)系.

系統(tǒng)類(lèi)型
聲音識(shí)別系統(tǒng)被分為文本相關(guān)和文本無(wú)關(guān)的兩類(lèi):
1、文本相關(guān)系統(tǒng)
文本相關(guān)系統(tǒng)要求使用者重復(fù)指定的話(huà)語(yǔ),通常包含與訓(xùn)練信息相同的文本。文本相關(guān)的識(shí)別方法多采用動(dòng)態(tài)時(shí)間伸縮法或隱馬爾可夫模型法:動(dòng)態(tài)時(shí)間伸縮法使用瞬間的變動(dòng)倒頻,其倒頻譜的計(jì)算通常使用快速付立葉變換;隱馬爾可夫模型法使用較成熟,它運(yùn)用該模型測(cè)量頻譜特征的統(tǒng)計(jì)變量,應(yīng)用較多。

2、文本無(wú)關(guān)系統(tǒng)
文本無(wú)關(guān)系統(tǒng)則沒(méi)有文本相關(guān)系統(tǒng)那樣的限制,但不一致的環(huán)境造成的性能下降是其應(yīng)用中的障礙。文本無(wú)關(guān)系統(tǒng)的識(shí)別方法采用平均頻譜法、矢量量化法與多變量自回歸法:平均頻譜法使用有利的倒頻距離,用平均頻譜除去語(yǔ)音頻譜中的音位影響;矢量量化法是用一套短期訓(xùn)練的特征向量來(lái)直接描述聲音的本質(zhì)特征,但存貯和計(jì)算的量大,需尋找有效的方法來(lái)壓縮訓(xùn)練數(shù)據(jù);多變量自回歸法是在倒頻向量的時(shí)序中,用多變量自回歸模式來(lái)確定聲音特征,其效果較好。

聲音識(shí)別的優(yōu)缺點(diǎn)
1、聲音識(shí)別技術(shù)的優(yōu)點(diǎn)
·同面像識(shí)別與步態(tài)識(shí)別一樣,聲音識(shí)別也是一種非接觸的識(shí)別技術(shù);
·由于大多數(shù)的計(jì)算機(jī)都有聲卡和麥克風(fēng),因而有廉價(jià)的硬件設(shè)備;
·聲音識(shí)別系統(tǒng)使用方便、簡(jiǎn)單,用戶(hù)易于接受;
·微型拾音器易于隱蔽,能方便用于竊聽(tīng),以鑒別是否罪犯等。

2、聲音識(shí)別技術(shù)的缺點(diǎn)
·聲音會(huì)隨著音量、速度和音質(zhì)的變化(如同一個(gè)人感冒、情緒壓力或青春期引起的變化),而影響采集與比對(duì)的結(jié)果;
·和其他的行為識(shí)別技術(shù)一樣,聲音因?yàn)樽兓姆秶?,故而很難進(jìn)行一些精確的匹配,因而比指紋識(shí)別誤識(shí)率高;
·能偽造,如容易用錄在磁帶上的聲音欺騙聲音識(shí)別系統(tǒng),所以安全可靠性較差;
·目前非常好的高保真的聲音采集裝置——麥克風(fēng)還比較昂貴。[nextpage]

制約聲音識(shí)別技術(shù)發(fā)展的關(guān)鍵
實(shí)際上,人們很早就認(rèn)識(shí)到聲音識(shí)別對(duì)于人類(lèi)生活的重要性。如世界上第一臺(tái)計(jì)算機(jī)問(wèn)世之后,馬上就有人想到要讓計(jì)算機(jī)聽(tīng)懂人說(shuō)話(huà)。因此可以說(shuō),聲音識(shí)別的研究歷史與計(jì)算機(jī)的發(fā)展歷史一樣長(zhǎng)。而計(jì)算機(jī)的發(fā)展已經(jīng)經(jīng)歷了好幾代,今天已經(jīng)進(jìn)入到了普通家庭。但是,聲音識(shí)別方面的產(chǎn)品卻遲遲未能進(jìn)入市場(chǎng)。

一個(gè)聲音識(shí)別系統(tǒng)性能好壞的關(guān)鍵,首先是它所采用的聲音模型能否真實(shí)地反映聲音的物理變化規(guī)律。但聲音信號(hào)與人類(lèi)的自然聲音都是隨機(jī)的、多變的和不穩(wěn)定的,因此很難把握,這就是目前聲音識(shí)別過(guò)程中的最大難點(diǎn)。

其次,模板訓(xùn)練的好壞也直接關(guān)系到聲音識(shí)別系統(tǒng)識(shí)別率的高低。為了得到一個(gè)好的模板,往往需要有大量的原始聲音數(shù)據(jù)來(lái)訓(xùn)練聲音模型。因此,在開(kāi)始進(jìn)行聲音識(shí)別研究之前,首先要建立起一個(gè)龐大的聲音數(shù)據(jù)庫(kù)。一個(gè)好的聲音數(shù)據(jù)庫(kù)包括足夠數(shù)量、具有不同性別、年齡、口音的說(shuō)話(huà)人的聲音,并且必須要有代表性,能均衡地反映實(shí)際使用情況。

有了聲音數(shù)據(jù)庫(kù)及聲音特征,就可以建立聲音模型,并用聲音數(shù)據(jù)庫(kù)中的聲音來(lái)訓(xùn)練這個(gè)聲音模型。訓(xùn)練過(guò)程是指選擇系統(tǒng)的某種最佳狀態(tài)(如對(duì)聲音庫(kù)中的所有聲音有最好的識(shí)別率),不斷地調(diào)整系統(tǒng)模型(或模板)的參數(shù),使系統(tǒng)模型的性能不斷向這種最佳狀態(tài)逼近。這是一個(gè)復(fù)雜的過(guò)程,要求計(jì)算機(jī)有強(qiáng)大的計(jì)算能力,并有很強(qiáng)的理論指導(dǎo),才能保證得到良好的訓(xùn)練結(jié)果。

實(shí)際上,制約聲音識(shí)別技術(shù)發(fā)展的關(guān)鍵是其依據(jù)的模型和算法,模型算法是計(jì)算機(jī)描述聲音的能力能否抓住人的聲音的本質(zhì)的關(guān)鍵。在聲音識(shí)別領(lǐng)域,固然有資金實(shí)力、人力資源等的競(jìng)爭(zhēng),但最根本是其關(guān)鍵核心技術(shù)——模型和算法的競(jìng)爭(zhēng)。

在聲音識(shí)別應(yīng)用領(lǐng)域,有許多相關(guān)技術(shù)直接影響著客戶(hù)的最終體驗(yàn),并關(guān)系到應(yīng)用系統(tǒng)的使用效果,也就是自動(dòng)化率(automation rate),即系統(tǒng)毋須人工干預(yù)獨(dú)自完成的比例。例如端點(diǎn)檢測(cè)及相關(guān)問(wèn)題,噪音環(huán)境下的聲音處理,系統(tǒng)結(jié)構(gòu),對(duì)口音的適應(yīng)性及聲音界面的設(shè)計(jì),都是聲音識(shí)別整體應(yīng)用系統(tǒng)需要考慮的。

聲音識(shí)別在國(guó)內(nèi)所取得的成果
計(jì)算機(jī)自動(dòng)聲音識(shí)別就是讓計(jì)算機(jī)能聽(tīng)懂人說(shuō)話(huà)。這一問(wèn)題曾經(jīng)被一位知名的美國(guó)教授稱(chēng)之為是“比登月還難”的科學(xué)難題。其實(shí),人們很早就認(rèn)識(shí)到聲音識(shí)別對(duì)于人類(lèi)生活的重要性。世界上第一臺(tái)計(jì)算機(jī)問(wèn)世之后,馬上就有人想到要讓計(jì)算機(jī)聽(tīng)懂人說(shuō)話(huà)。所以說(shuō),聲音識(shí)別的研究歷史與計(jì)算機(jī)的發(fā)展歷史一樣長(zhǎng)。計(jì)算機(jī)的發(fā)展已經(jīng)經(jīng)歷了好幾代,今天已經(jīng)進(jìn)入到了普通家庭。但是,聲音識(shí)別方面的產(chǎn)品卻遲遲未能進(jìn)入市場(chǎng)。

我國(guó)聲音識(shí)別研究工作起步于五十年代,但近年來(lái)發(fā)展很快,研究水平也從實(shí)驗(yàn)室逐步走向?qū)嵱谩?987年開(kāi)始執(zhí)行國(guó)家863計(jì)劃后,我國(guó)聲音識(shí)別技術(shù)的研究水平已經(jīng)基本上與國(guó)外同步,在漢語(yǔ)聲音識(shí)別技術(shù)上還有自己的特點(diǎn)與優(yōu)勢(shì),并達(dá)到國(guó)際先進(jìn)水平。其中具有代表性的研究單位為清華大學(xué)電子工程系與中科院自動(dòng)化研究所模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室。

清華大學(xué)電子工程系語(yǔ)音技術(shù)與專(zhuān)用芯片設(shè)計(jì)課題組,研發(fā)的非特定人漢語(yǔ)數(shù)碼串連續(xù)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別精度,達(dá)到94.8%(不定長(zhǎng)數(shù)字串)和96.8%(定長(zhǎng)數(shù)字串)。在有5%的拒識(shí)率情況下,系統(tǒng)識(shí)別率可以達(dá)到96.9%(不定長(zhǎng)數(shù)字串)和98.7%(定長(zhǎng)數(shù)字串),這是目前國(guó)際最好的識(shí)別結(jié)果之一,其性能已經(jīng)接近實(shí)用水平。研發(fā)的5000詞郵包校核非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)的識(shí)別率達(dá)到98.73%,前三選識(shí)別率達(dá)99.96%;并且可以識(shí)別普通話(huà)與四川話(huà)兩種語(yǔ)言,己基本達(dá)到實(shí)用要求。[nextpage]

國(guó)內(nèi)研發(fā)的第一塊語(yǔ)音識(shí)別專(zhuān)用芯片,以8位微控制器(MCU)為核心,加上低通濾波器、A/D、D/A、預(yù)放、功率放大器、RAM、ROM、脈寬調(diào)幅(PWM)等模塊,構(gòu)成了一個(gè)完整的系統(tǒng)芯片。這種芯片包括了語(yǔ)音識(shí)別、語(yǔ)音編碼、語(yǔ)音合成功能,可以識(shí)別30條特定人語(yǔ)音命令,識(shí)別率超過(guò)95%,其中的語(yǔ)音編碼速率為16kbits/s。因此,該芯片可以用于智能語(yǔ)音玩具;也可以與普通電話(huà)機(jī)相結(jié)合構(gòu)成語(yǔ)音撥號(hào)電話(huà)機(jī)。這些系統(tǒng)的識(shí)別性能完全達(dá)到國(guó)際先進(jìn)水平,一些應(yīng)用型產(chǎn)品正在研發(fā)中,其商品化的過(guò)程將越來(lái)越快。

由于一些微型機(jī)器,如手機(jī)、掌上電腦等體積較小,難以設(shè)計(jì)鍵盤(pán)輸入復(fù)雜指令,而語(yǔ)音識(shí)別恰能實(shí)現(xiàn)這一需求。但中文語(yǔ)音識(shí)別產(chǎn)品一直由外國(guó)大公司壟斷,中科院研究人員針對(duì)漢語(yǔ)聲調(diào)、口音和語(yǔ)言特性進(jìn)行了大量創(chuàng)新,攻克了語(yǔ)音識(shí)別領(lǐng)域最難的非特定人漢語(yǔ)6萬(wàn)詞連續(xù)語(yǔ)音技術(shù)。在同等測(cè)試條件下,中科院開(kāi)發(fā)的這項(xiàng)技術(shù)在識(shí)別性能上優(yōu)于跨國(guó)公司公開(kāi)發(fā)表的結(jié)果。其中文語(yǔ)音識(shí)別軟件,對(duì)普通話(huà)的識(shí)別率可達(dá)95%以上。具有自主知識(shí)產(chǎn)權(quán)的語(yǔ)音技術(shù),一定會(huì)像漢字識(shí)別技術(shù)一樣不但在技術(shù)上取得成功,而且在產(chǎn)業(yè)化和市場(chǎng)化上取得突破,從而進(jìn)一步奠定中國(guó)在中文信息處理上的優(yōu)勢(shì)。

目前,自動(dòng)化所控股的中科模識(shí)科技有限責(zé)任公司,己同其他公司合作開(kāi)發(fā)了基于中文語(yǔ)音識(shí)別技術(shù)的移動(dòng)電話(huà)語(yǔ)音交互系統(tǒng)、互聯(lián)網(wǎng)中文多模態(tài)交互平臺(tái)、智能家居聲控系統(tǒng)、電話(huà)股票查詢(xún)系統(tǒng)、電視機(jī)中文語(yǔ)音遙控器等。

盡管有關(guān)聲音識(shí)別技術(shù)的報(bào)道屢見(jiàn)不鮮,國(guó)內(nèi)外學(xué)者也為此作了不懈的努力,但目前聲音識(shí)別系統(tǒng)的識(shí)別率還比較低,現(xiàn)在均在進(jìn)行深化與實(shí)用化的研究。相信不久,會(huì)有比較好的實(shí)用產(chǎn)品出現(xiàn)。

聲音識(shí)別在安防等方面的應(yīng)用
聲音識(shí)別系統(tǒng)可應(yīng)用的范圍很廣,如可用于電話(huà)與通信網(wǎng)絡(luò)、人機(jī)接口、安防監(jiān)控、股票交易與銀行取款、智能玩具、刑偵破案、罪犯跟蹤、國(guó)防監(jiān)聽(tīng)、財(cái)產(chǎn)保護(hù)等方面。

用于電話(huà)與通信網(wǎng)絡(luò)
如在電話(huà)機(jī)、手機(jī)中已經(jīng)包含了語(yǔ)音識(shí)別撥號(hào)功能,人們可以通過(guò)語(yǔ)音命令方便地從遠(yuǎn)端的數(shù)據(jù)庫(kù)系統(tǒng)中查詢(xún)與提取有關(guān)的信息。如人們可以通過(guò)電話(huà)網(wǎng)絡(luò),用語(yǔ)音識(shí)別口語(yǔ)對(duì)話(huà)系統(tǒng)查詢(xún)有關(guān)的機(jī)票、旅游、銀行等信息。

美國(guó)主要電信運(yùn)營(yíng)商Sprint的PCS部門(mén),自2000年以來(lái)為客戶(hù)開(kāi)通了語(yǔ)音驅(qū)動(dòng)系統(tǒng),提供客戶(hù)服務(wù)、語(yǔ)音撥號(hào)、查號(hào)和更改地址等業(yè)務(wù)。2001年9月開(kāi)通的可以自然方式對(duì)話(huà)的咨詢(xún)系統(tǒng),更實(shí)現(xiàn)了以自然、開(kāi)放的詢(xún)問(wèn)方式實(shí)時(shí)獲得所需要的信息。加拿大最大的電信運(yùn)營(yíng)商,也擁有多個(gè)語(yǔ)音驅(qū)動(dòng)系統(tǒng),提供從客戶(hù)服務(wù),增值業(yè)務(wù)和資訊服務(wù)多種功能。這些系統(tǒng)不但減少了用戶(hù)的投訴,并為無(wú)線(xiàn)網(wǎng)絡(luò)服務(wù)增值,從而增強(qiáng)了客戶(hù)的誠(chéng)信度,也開(kāi)辟了新的收入來(lái)源。

用于人機(jī)接口
現(xiàn)在,聲音識(shí)別正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù),聲音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行操作。因?yàn)殡S著計(jì)算機(jī)的小型化,鍵盤(pán)已經(jīng)成為移動(dòng)平臺(tái)的一個(gè)很大障礙,如果手機(jī)僅僅只有一個(gè)手表那么大,再用鍵盤(pán)進(jìn)行撥號(hào)操作已經(jīng)是不可能的。所以,聲音識(shí)別技術(shù)的研發(fā)與應(yīng)用,已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高科技術(shù)產(chǎn)業(yè)。

用于股票交易與銀行取款物
1996年9月,Charles Schwab開(kāi)通了首個(gè)大規(guī)模商用語(yǔ)音識(shí)別應(yīng)用系統(tǒng),股票報(bào)價(jià)系統(tǒng)與語(yǔ)音股票交易系統(tǒng)。該系統(tǒng)有效地提高了服務(wù)質(zhì)量和客戶(hù)滿(mǎn)意度,并減少了呼叫中心的費(fèi)用。[nextpage]

尤其在銀行的應(yīng)用上,還可同密碼一同打開(kāi)保險(xiǎn)箱柜與儲(chǔ)蓄取款,既方便又可靠。

用于刑偵破案、打擊恐怖分子
公安刑警采用聲音識(shí)別技術(shù),可利用暗藏在犯罪分子的電話(huà)、錄像或者其他證據(jù)中的聲音資料,和嫌疑人的聲音進(jìn)行對(duì)比,以尋找到真正的兇手。

實(shí)施綁架的罪犯往往會(huì)通過(guò)電話(huà)向被害者的家屬索要贖金,警方可通過(guò)聲音識(shí)別從數(shù)個(gè)嫌疑人中認(rèn)出罪犯。如日本曾經(jīng)發(fā)生一起綁架少女案。女孩的父親接到一個(gè)人打來(lái)的電話(huà),要他用重金贖回女兒。警方作了電話(huà)錄音,然后在廣播電臺(tái)和電視臺(tái)播放了這次電話(huà)錄音。經(jīng)群眾檢舉,有10多個(gè)人被警方列為嫌疑人,并通過(guò)各種渠道錄下嫌疑人的聲音。經(jīng)過(guò)聲紋鑒定,終于從這些嫌疑人中找到了真正的罪犯。

此外,現(xiàn)代的恐怖分子有恃無(wú)恐,制造恐怖事件后往往還會(huì)拍下一段錄像宣稱(chēng)為某事件負(fù)責(zé),安全局的特警就可以根據(jù)這些聲音資料,分析錄像中的聲音是否為恐怖分子本人的聲音,從而可以為追查恐怖分子獲得新的線(xiàn)索。

用于法庭作證
因辦案講究的是證據(jù),而聲音也是偵查犯罪的一項(xiàng)有力證據(jù)。為此,研究聲音證據(jù)的“法庭語(yǔ)音學(xué)”(Forensic Phonetics)成為了法庭醫(yī)學(xué)的一門(mén)重要的分支學(xué)科。除了聲紋技術(shù)外,法庭語(yǔ)音學(xué)的研究方法還包括制作聲譜圖和進(jìn)行聲音比較聲譜圖,對(duì)聲音加以記錄,并將其轉(zhuǎn)變?yōu)槁曌V圖或聲紋的直觀(guān)形式。在進(jìn)行聲音比較時(shí),聲音識(shí)別專(zhuān)家會(huì)對(duì)聲音的相似之處以及不同之處加以辨別,這些相似或不同之處涉及呼吸方式、語(yǔ)調(diào)的抑揚(yáng)變化、不尋常的語(yǔ)音習(xí)慣方言等。因此,要利用“法庭語(yǔ)音學(xué)”成為偵查犯罪的有利幫手,就需要建立一套像指紋系統(tǒng)那樣的自動(dòng)化的語(yǔ)音鑒定系統(tǒng)。

到了20世紀(jì)70年代,日本、羅馬尼亞、德國(guó)等國(guó)家都相繼開(kāi)展了聲紋鑒定技術(shù),以對(duì)付恐怖犯罪活動(dòng)。最近幾年來(lái),世界各國(guó)的司法機(jī)構(gòu)都開(kāi)始接受聲紋證據(jù)。在美國(guó),已有八分之七的州上訴法院承認(rèn)聲紋可作為法庭證據(jù),美國(guó)的軍事法庭也采用聲紋作為證據(jù)。隨著科學(xué)技術(shù)的進(jìn)步,聲紋鑒定手段也日益先進(jìn)。

用于國(guó)防監(jiān)聽(tīng)
聲音識(shí)別用于國(guó)防監(jiān)聽(tīng),從下述的例證就知其重要性。如美軍在近幾年使用的EP-3偵察機(jī)上,安裝了最先進(jìn)的聲音識(shí)別系統(tǒng)。這種聲音自動(dòng)識(shí)別系統(tǒng)功能強(qiáng)大,只要被偵察者通過(guò)無(wú)線(xiàn)電進(jìn)行對(duì)話(huà),系統(tǒng)便能查明通話(huà)者的身份,尤其是高層領(lǐng)導(dǎo)者的身份更是全在識(shí)別之列,從而判斷出從中掌握到的情報(bào)的價(jià)值到底有多大。要做到這一點(diǎn)在以前是一件難以想像的事,因?yàn)樵胍魡?wèn)題無(wú)法解決?,F(xiàn)在,監(jiān)聽(tīng)系統(tǒng)能自己刪除靜電等其他雜音,然后通過(guò)與聲音數(shù)據(jù)庫(kù)相對(duì)照,就能識(shí)別出通話(huà)者的身份。

多年來(lái),美國(guó)建有一個(gè)功能強(qiáng)大的資料數(shù)據(jù)系統(tǒng),儲(chǔ)存有世界上幾乎所有領(lǐng)導(dǎo)人的各種相關(guān)資料。所有的國(guó)家領(lǐng)導(dǎo)人由于其口音、停頓、用詞或表達(dá)習(xí)慣不同,因此都有著特定的識(shí)別方式。對(duì)于采集到的各國(guó)領(lǐng)導(dǎo)人的聲音資料,為便于使用,美國(guó)中央情報(bào)局對(duì)聲音加以記錄,并將其轉(zhuǎn)變?yōu)槁曌V圖或聲紋的直觀(guān)形式。當(dāng)卡塔爾電視臺(tái)播出薩達(dá)姆的講話(huà)錄音后,他們首先將錄音帶中的聲音與資料庫(kù)中存儲(chǔ)的聲音進(jìn)行對(duì)比,辨別出其相似之處及不同之處,這些相似或不同之處涉及呼吸方式、語(yǔ)調(diào)的抑揚(yáng)變化、不尋常的語(yǔ)音習(xí)慣以及地方方言等。從而發(fā)現(xiàn)資料庫(kù)中的聲紋與錄音帶中的聲紋基本一致,而且包含有部分相同的單詞。所以,美國(guó)中央情報(bào)局當(dāng)時(shí)認(rèn)定錄音帶中的聲音“十有八九是薩達(dá)姆本人”。

美國(guó)國(guó)家安全局還把聲音識(shí)別技術(shù)用于辨別“榜上有名”的恐怖分子,如本·拉登。美軍只有把其新舊講話(huà)的聲音作對(duì)比,借此來(lái)判斷他是否真的還存活人世。日本聲響實(shí)驗(yàn)室的研究人員甚至能根據(jù)拉登的聲紋來(lái)判斷他的健康狀況,并發(fā)現(xiàn)拉登在逃亡過(guò)程中的健康狀況持續(xù)惡化等。

用于保護(hù)人民財(cái)產(chǎn)
聲音識(shí)別技術(shù)可以用于保護(hù)人民的財(cái)產(chǎn)不受非法侵犯,人們?cè)谥匾呢?cái)產(chǎn)(比如住房、汽車(chē)、電器)上,可安裝聲音識(shí)別系統(tǒng),只有用戶(hù)本人的聲音可以啟動(dòng)這些財(cái)產(chǎn),而違法分子則對(duì)之束手無(wú)策。

由于聲紋具有不會(huì)遺失或忘記、不需記憶、使用方便等優(yōu)點(diǎn),因此在保護(hù)人們的財(cái)產(chǎn)、防止盜竊或者其他經(jīng)濟(jì)犯罪方面會(huì)有更大的用途。它更適用于電話(huà)銀行、電話(huà)炒股、電子購(gòu)物等領(lǐng)域。

最近,美國(guó)加利福尼亞州一家信用卡公司發(fā)明了一種帶有聲音識(shí)別功能的信用卡,這種信用卡只有在識(shí)別出主人的聲音后才能正常操作,可以有效打擊那些偷取信用卡進(jìn)行消費(fèi)的小偷。信用卡中安裝有一個(gè)小麥克風(fēng)、一個(gè)揚(yáng)聲器和一個(gè)具有聲音識(shí)別功能的芯片。在使用信用卡之前,用戶(hù)必須說(shuō)出密碼,芯片將有聲密碼與事先錄下的密碼相比較,如果密碼符合,卡片將發(fā)出一串“嗶嗶”的聲音,表示可以通過(guò)電話(huà)或商店計(jì)算機(jī)的麥克風(fēng)進(jìn)行交易。如果聲音不符合,則不會(huì)發(fā)聲。目前這一設(shè)備仍在樣品測(cè)試階段,一旦面世它將被用于在電話(huà)和網(wǎng)絡(luò)上驗(yàn)證信用卡用戶(hù)的身份,從而減少信用卡欺詐導(dǎo)致的商家和消費(fèi)者的交易成本。

用于安防監(jiān)聽(tīng),以阻止罪犯繼續(xù)作案
在安防監(jiān)控領(lǐng)域,通常還有監(jiān)聽(tīng),如果安裝有聲音識(shí)別的智能化功能,就可以尋找到通輯逃犯、慣犯以及一切留有聲音檔案的罪犯,從而可及時(shí)阻止這些罪犯繼續(xù)作案。 此外,聲音識(shí)別技術(shù)還可用于門(mén)禁系統(tǒng)及各種鎖具中,使“芝麻開(kāi)門(mén)”變成現(xiàn)實(shí)。

用于智能玩具等
聲音識(shí)別技術(shù)還可用于玩具中,以形成語(yǔ)音智能玩具等產(chǎn)品。

結(jié)語(yǔ)
由上述可知,由于聲音識(shí)別技術(shù)有硬件設(shè)備簡(jiǎn)單、低廉,且使用方便,易于被人們所接受等優(yōu)點(diǎn),因而應(yīng)用很廣泛,并一直成為國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)。雖然,使聲音識(shí)別技術(shù)真正實(shí)用化還有一定的難度,但國(guó)內(nèi)外學(xué)者在為此作不懈地努力,相信不久,會(huì)有比較好的實(shí)用產(chǎn)品出現(xiàn)。

參與評(píng)論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評(píng)論區(qū)僅供其表達(dá)個(gè)人看法,并不表明a&s觀(guān)點(diǎn)。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專(zhuān)業(yè)媒體平臺(tái),自1994年品牌成立以來(lái),一直專(zhuān)注于安全&自動(dòng)化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場(chǎng)趨勢(shì)的專(zhuān)業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國(guó)際行業(yè)展覽會(huì)資源以及豐富的媒體經(jīng)驗(yàn),提供媒體、活動(dòng)、展會(huì)等整合營(yíng)銷(xiāo)服務(wù)。

免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無(wú)意。如您是字體廠(chǎng)商、圖片文字廠(chǎng)商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號(hào) 粵公網(wǎng)安備 44030402000264號(hào)
用戶(hù)
反饋