語(yǔ)音技術(shù)之外,19 歲科大訊飛還有更多想要改變的事情。
按一個(gè)人的年齡計(jì)算,19 歲意味著剛剛成年,即將感受社會(huì)萬(wàn)千,但從企業(yè)發(fā)展時(shí)間來(lái)看,已經(jīng) 19 歲的科大訊飛無(wú)疑已經(jīng)經(jīng)歷了太多風(fēng)云變化,這家市值超過(guò) 700 億元的中國(guó)公司,在科技領(lǐng)域算是久經(jīng)沙場(chǎng)。
從智能語(yǔ)音技術(shù)起步,開(kāi)發(fā)智能語(yǔ)音平臺(tái),建立中文語(yǔ)音交互技術(shù)標(biāo)準(zhǔn),科大訊飛在人工智能領(lǐng)域逐漸成為領(lǐng)軍者,而伴隨在消費(fèi)端的產(chǎn)品持續(xù)輸出,訊飛輸入法、訊飛翻譯機(jī)等則讓越來(lái)越多人看到了中國(guó)科技企業(yè)在人工智能領(lǐng)域的躍進(jìn)。
今年 5 月,曾任職微軟亞洲研究院首席研究員、副院長(zhǎng)、微軟公司合伙人的李世鵬加入科大訊飛,擔(dān)任科大訊飛副總裁、訊飛 AI 研究院聯(lián)席院長(zhǎng),在業(yè)內(nèi)引起不小轟動(dòng)。
李世鵬于 1995 年正式進(jìn)入微軟,2015 年出任硬蛋科技 CTO,其主要研究領(lǐng)域是信號(hào)與圖像處理、圖像與視頻編碼、應(yīng)用層網(wǎng)絡(luò)技術(shù)、數(shù)字版權(quán)管理及無(wú)線通信與網(wǎng)絡(luò)等,這些領(lǐng)域與人工智能技術(shù)存在很多分叉,伴隨李世鵬的加入,科大訊飛的未來(lái)之路無(wú)疑引起外界更多好奇。
7 月 21 日,李世鵬教授在某個(gè)以人工智能為主題的論壇上向人們分享了科大訊飛將如今通過(guò)人工智能技術(shù)進(jìn)一步影響不同行業(yè),以及科大訊飛的人工智能未來(lái)會(huì)邁向何方。
以下內(nèi)容來(lái)自李世鵬教授演講分享:
從感知智邁向認(rèn)知智能
我們知道人工智能有兩個(gè)途徑,一是現(xiàn)在大家習(xí)以為常,通過(guò)深度學(xué)習(xí)和大數(shù)據(jù)的方式來(lái)研究人工智能。這種方法現(xiàn)在是 99% 以上的公司都在做的,確實(shí)在很多領(lǐng)域能幫助我們提高生產(chǎn)效率。
但這個(gè)方法最大的瓶頸就是數(shù)據(jù),能不能有更聰明的人工智能最后取決于能不能更有效的獲得一些被標(biāo)注的數(shù)據(jù)。如果你用更多的數(shù)據(jù)就能讓人工智能做更多的事情。如果大家到深圳或者其他傳統(tǒng)的生產(chǎn)線去看,很多生產(chǎn)線改成了數(shù)據(jù)標(biāo)注線,很多工人在那兒標(biāo)注數(shù)據(jù)。從另外一個(gè)層面反映現(xiàn)在大部分人工智能還是一個(gè)「人工」。
另外一條路,就是對(duì)人腦的認(rèn)知。通過(guò)對(duì)人腦的研究去找到一些新方法?,F(xiàn)在有一個(gè)理論,就是通過(guò)小數(shù)據(jù)構(gòu)建大模型。假如你給某人看一個(gè)杯子,他看幾次就知道,下次再看到盡管不是同樣形狀的但這還是一個(gè)杯子。
因?yàn)槿说恼J(rèn)知不單是形狀,還從功能上去認(rèn)識(shí)這個(gè)杯子。怎樣在人腦認(rèn)知種發(fā)現(xiàn)人工智能一些新的認(rèn)識(shí)?這是很好的研究課題,也是科大訊飛聯(lián)合很多世界頂尖學(xué)校比如 MIT 等在做的事情。
現(xiàn)在大部分人工智能還停留在感知智能階段。感知智能包括語(yǔ)音識(shí)別,就包括翻譯、人臉識(shí)別等,但真正對(duì)內(nèi)容的理解沒(méi)有那么深。而更高一級(jí),認(rèn)知智能是更高層次的對(duì)內(nèi)容的認(rèn)識(shí),這是真正人工智能的必經(jīng)之路。
認(rèn)知就是嘗試?yán)斫猓?2017 年 10 月份科大訊飛參加了斯坦福大學(xué)發(fā)起的閱讀理解測(cè)試,是當(dāng)時(shí)的世界紀(jì)錄保持者,經(jīng)過(guò)這段時(shí)間進(jìn)展,很多其他研究單位也趕上來(lái)了,但是我們現(xiàn)在還是世界上三個(gè)在閱讀理解能力超過(guò)人的閱讀能力的公司之一。
第二,用機(jī)器人或人工智能來(lái)對(duì)論文、作文進(jìn)行評(píng)估。我們目前對(duì)中文的作文和英文的作文,都進(jìn)行了很有效的評(píng)估。這一系統(tǒng)已經(jīng)在江蘇大學(xué)的入學(xué)考試中投入使用。除了更準(zhǔn)確之外,它還比人更有一致性,這一點(diǎn)很重要。
過(guò)去我們通過(guò)圖靈測(cè)試測(cè)試機(jī)器的認(rèn)知程度,現(xiàn)在很多機(jī)器都可以達(dá)到這樣的水平,所以就有了改進(jìn)版的測(cè)試方式 Winograd Schema Challenge,它從一些常識(shí)性的知識(shí)推理來(lái)看機(jī)器是否達(dá)到了認(rèn)知。
比如說(shuō)「爸爸沒(méi)法舉起兒子,因?yàn)樗苤亍惯@個(gè)問(wèn)題,這里面在問(wèn)誰(shuí)重?我們?nèi)嘶卮鸷芎?jiǎn)單,就是通過(guò)直覺(jué)肯定兒子重,所以爸爸舉不起來(lái)。但機(jī)器來(lái)回答這個(gè)問(wèn)題可能就沒(méi)有那么容易了,因?yàn)樗麤](méi)有這個(gè)常識(shí)和直覺(jué)。常識(shí)性問(wèn)題,是人工智能領(lǐng)域研究的熱門(mén)課題。如果這個(gè)方面有突破的話,我相信人的認(rèn)知方面就有很大的進(jìn)展。
從語(yǔ)音向綜合場(chǎng)景擴(kuò)展
我們?nèi)ツ暾故玖苏Z(yǔ)音合成聲音的成果,今年又有一些進(jìn)展。我們可以以任何人的口氣講任何的話,甚至是任何的語(yǔ)音。這聽(tīng)上去有點(diǎn)可怕,但是我們可以為人做更好的服務(wù)。比如你可以用父母的聲音給小孩講故事,或者用已經(jīng)不在的老人的聲音給孩子講話,這都是有價(jià)值的應(yīng)用。
2015 年,科大訊飛的機(jī)器識(shí)別速度超過(guò)了人類的速記員,今天看到后面還有速記員,如果用科大訊飛的語(yǔ)音識(shí)別技術(shù)的話一,很多繁雜的工作就不需要了。這是人工智能在速記上已經(jīng)產(chǎn)生的影響。
方言識(shí)別方面,科大訊飛現(xiàn)在能識(shí)別至少 22 種方言,這是很有用的。比如今天在成都,其實(shí)四川話的識(shí)別就和標(biāo)準(zhǔn)普通話的識(shí)別完全不同。我們可以做到用標(biāo)準(zhǔn)的四川話來(lái)講,如果大家用科大訊飛的語(yǔ)音輸入法就知道這項(xiàng)技術(shù)的方便。
訊飛翻譯機(jī)和訊飛聽(tīng)見(jiàn)解決的是不同場(chǎng)景下的翻譯問(wèn)題。訊飛翻譯機(jī) 2.0 上市以來(lái)就處于供不應(yīng)求的狀態(tài),最近也剛剛被總理自掏腰包購(gòu)買(mǎi),成為國(guó)禮。這些都是我們的網(wǎng)紅產(chǎn)品。但我們不單自己用自己的技術(shù)。我們也把這套技術(shù)完全開(kāi)放給合作伙伴,就是 AIUI 開(kāi)發(fā)系統(tǒng)。
截至 2018 年 6 月 30 日,訊飛開(kāi)放平臺(tái)開(kāi)發(fā)者團(tuán)隊(duì)數(shù) 88 萬(wàn),覆蓋終端數(shù) 19 億,日均交互服務(wù) 46 億次,AI 大學(xué)學(xué)員 22 萬(wàn)。
我們還把 AI 技術(shù)應(yīng)用到了醫(yī)療領(lǐng)域,包括醫(yī)療影像??拼笥嶏w不再是一個(gè)只是在語(yǔ)音方面有專長(zhǎng)的公司,在視覺(jué)也有很大的進(jìn)展。在去年,我們成為中國(guó)第一個(gè)通過(guò)醫(yī)考的機(jī)器人,拿到 456 分的成績(jī),超過(guò)了 95% 的考生。利用這套技術(shù)和相關(guān)的一些數(shù)據(jù),我們?cè)谧鲋袊?guó)首家人工智能醫(yī)院,去幫助醫(yī)生提高診斷準(zhǔn)確率。
人工智能也在改變教育領(lǐng)域。從古到今大家熟悉的教育方式都是一個(gè)老師在講課,下面的學(xué)生都在聽(tīng),人工智能可以做到精準(zhǔn)教學(xué)、個(gè)性化學(xué)習(xí)。因?yàn)橥ㄟ^(guò)試卷和作業(yè)的分析,AI 能清楚的知道每個(gè)學(xué)生的知識(shí)薄弱點(diǎn)。教師通過(guò)這種數(shù)據(jù)可以進(jìn)行有效的精準(zhǔn)教學(xué)。在布置作業(yè)的時(shí)候就可以針對(duì)性出題。提高效率的同時(shí),也省出時(shí)間去做課外興趣,這是對(duì)人類教育的重大的突破。
人跟機(jī)器怎樣進(jìn)行有效的和諧交互,是我們研究的重要課題。AI 目前還是輔助人產(chǎn)生效率的,但我們希望人的介入會(huì)進(jìn)一步加強(qiáng)機(jī)器的迭代,用人工智能建設(shè)美好世界,我們現(xiàn)在才剛剛邁出了一小步。