百度表示將為開發(fā)者提供百度大腦的聲學(xué)模型和語音模型,基礎(chǔ)服務(wù)免費(fèi),可永久使用。
百度語音喚醒技術(shù)目前主要應(yīng)用于百度小度機(jī)器人和百度車聯(lián)網(wǎng)CarLife/Codriver,喚醒率達(dá)95%,支持自定義喚醒詞和連續(xù)表達(dá)。用戶可以通過語音說出“小度你好,請(qǐng)播放一首古典音樂”的指令,或者“小度你好,今天百度的股價(jià)怎么樣?”的請(qǐng)求,都能得到響應(yīng)。除了小度機(jī)器人和車聯(lián)網(wǎng),該語音喚醒技術(shù)還可以應(yīng)用于手機(jī)和電視等不同的終端,于是百度希望開放該技術(shù)以加快普及和應(yīng)用。
自定義語義技術(shù)則主要開放了語義和語音的映射能力,幫助開發(fā)者和第三方廠商更快更準(zhǔn)確地提高語音識(shí)別率,比如地區(qū)方言、口音等識(shí)別。
目前,語音技術(shù)是百度主要專注的人工智能研究方向之一。此前在接受新浪科技采訪時(shí),百度首席科學(xué)家吳恩達(dá)曾表示,關(guān)于人工智能的研究方向很多,但百度優(yōu)先專注于語音識(shí)別相關(guān)的技術(shù)和無人車等領(lǐng)域。
2015年11月,吳恩達(dá)領(lǐng)導(dǎo)的百度硅谷實(shí)驗(yàn)室還推出了新一代語音識(shí)別技術(shù)Deep Speech2,被美國權(quán)威雜志《麻省理工評(píng)論》列為2016年十大突破性技術(shù)之一。
據(jù)百度語音相關(guān)負(fù)責(zé)人透露,Deep Speech2下一步將會(huì)被應(yīng)用在百度地圖產(chǎn)品中。