【人物簡介】李飛飛是斯坦福大學(xué)計(jì)算機(jī)系終身教授,斯坦福人工智能實(shí)驗(yàn)室和斯坦福視覺實(shí)驗(yàn)室主任。使用神經(jīng)網(wǎng)絡(luò)模型等機(jī)器學(xué)習(xí)算法,李飛飛帶領(lǐng)團(tuán)隊(duì)創(chuàng)造了能夠自動生成圖說的軟件,創(chuàng)建了全球最大的圖像識別數(shù)據(jù)庫 ImageNet,每年一度的 ImageNet 競賽都牽動著整個(gè)業(yè)界的心弦。李飛飛關(guān)于神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺的研究大幅推動了人工智能發(fā)展,可能為我們帶來更直觀的圖像搜索應(yīng)用,以及能夠在不熟悉的情況下做出決策的自主機(jī)器人。
人工智能 60 年一直在積累
Q:您怎么看 AI 這 60 年的發(fā)展?
李飛飛:我簡短地說一下。我把過去這 60 年的 AI 看作是“in vitro AI” ,也就是在實(shí)驗(yàn)室里的 AI。現(xiàn)在是 21 世紀(jì)的第 2 個(gè)十年,是 AI 的一個(gè)重要的歷史轉(zhuǎn)折點(diǎn),因?yàn)?in vitro AI 走向了 in vivo AI——成為走進(jìn)人們生活、走進(jìn)社會的 AI,雖然才剛邁出了第一步。過去 60 年是非常重要的 60 年,奠定了這個(gè)領(lǐng)域的基礎(chǔ),包括理論基礎(chǔ)和理論框架、軟硬件工具,尤其是數(shù)學(xué)、算法,以及 AI 需要關(guān)注的主要問題是什么,如何去衡量這些問題。過去的這 60 年,AI 有了長足的發(fā)展,站在工業(yè)界、投資界的角度,或許 AI 好像是平地而起的一個(gè)新興產(chǎn)業(yè),但實(shí)際上這 60 年一直都在積累。
Q:不過,近幾年 AI 投資非?;馃?,有什么特別的原因嗎?
李飛飛:原因我想也應(yīng)該是有目共睹的。深度學(xué)習(xí)的第二次崛起是 AI 從 in vitro 走向 in vivo 的一個(gè)重要轉(zhuǎn)折點(diǎn)。在我看來,有三個(gè)重要的因素,它們匯聚在一起,共同構(gòu)成了這個(gè)轉(zhuǎn)折點(diǎn)。一個(gè)是深度學(xué)習(xí)的理論框架,也就是是神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)從 20 世紀(jì) 70 年代、80 年代、90 年代不斷在發(fā)展、優(yōu)化。當(dāng)然,也有一段時(shí)間,神經(jīng)網(wǎng)絡(luò)不是最受歡迎的機(jī)器學(xué)習(xí)方式,但不管怎么說,在上個(gè)世紀(jì)末機(jī)器學(xué)習(xí)百花齊放的時(shí)候,神經(jīng)網(wǎng)絡(luò)是其中的一部分。然后走到 21 世紀(jì)初期,硬件在摩爾定律的推動下不斷推陳出新,尤其是 NVDIA 的 GPU 帶來了并行計(jì)算的騰興,像神經(jīng)網(wǎng)絡(luò)的高通量模型運(yùn)行。第三個(gè)非常重要的就是大數(shù)據(jù)。大數(shù)據(jù)的崛起與互聯(lián)網(wǎng)的崛起緊密相關(guān),互聯(lián)網(wǎng)又是上個(gè)世紀(jì) 90 年代的產(chǎn)物,經(jīng)過這十幾年的積累,互聯(lián)網(wǎng)帶來了大數(shù)據(jù)的爆發(fā)。所以,在人工智能領(lǐng)域,神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和計(jì)算機(jī)硬件,尤其是 GPU,這三個(gè)事件的聚合帶來了 2012 年左右深度學(xué)習(xí)的大爆發(fā)。
如果一定要指出一個(gè)事件,我會說是 2012 年 ImageNet 競賽 Geoffrey Hinton 和他的學(xué)生用深度卷積神經(jīng)網(wǎng)絡(luò)在圖像識別任務(wù)上取得了長足的進(jìn)步,他們當(dāng)時(shí)的計(jì)算結(jié)果比其他的算法都好很多,我想這可能是大家會記住的歷史事件,但背后也很多年的積累。
Q:您是計(jì)算機(jī)視覺面的專家,在這 60 年的歷史中,AI 領(lǐng)域?qū)δ绊懽畲蟮娜擞心男?/strong>
李飛飛:我的專業(yè)處在計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)的交叉點(diǎn),在機(jī)器學(xué)習(xí)方面,對我影響很大的兩個(gè)人是 Michael Jordan 和 Geoff Hinton,他們在各自的機(jī)器學(xué)習(xí)領(lǐng)域都作了巨大的貢獻(xiàn)。從我本科生開始到研究生,他們的論文一直引領(lǐng)著機(jī)器學(xué)習(xí)的新思路、不斷地探索。看 Geoff Hinton 這么多年寫的論文就可以發(fā)現(xiàn),他在神經(jīng)網(wǎng)絡(luò)這個(gè)子領(lǐng)域上做了各種探索,從最開始的反向傳播算法,到生成模型、判別模型、各種不同的推理……深度學(xué)習(xí)本身是有很長歷史的子領(lǐng)域,Geoff Hinton 一直是深度學(xué)習(xí)的領(lǐng)軍人。同樣重要的一個(gè)人物是 Michael Jordan,是 Michael Jordan 把機(jī)器學(xué)習(xí)統(tǒng)計(jì)學(xué)的概念帶進(jìn)了這個(gè)領(lǐng)域,而且他的工作一直在理論和應(yīng)用之間保持非常好的平衡。我做研究生的時(shí)候,他很多 topic model、梯度下降……他的學(xué)生現(xiàn)在已經(jīng)分散在各個(gè)重要的高校,在領(lǐng)軍機(jī)器學(xué)習(xí)。所以,這兩個(gè)人是在機(jī)器學(xué)習(xí)方面對我影響最大的。
在計(jì)算機(jī)視覺方面,我覺得一個(gè)重要的人物是 Jitendra Malik,他是伯克利的教授。Jitendra Malik 把計(jì)算機(jī)視覺這個(gè)領(lǐng)域從圖像處理帶進(jìn)了 AI。這是一個(gè)非常重要的理念,在上世紀(jì)六七十年代,計(jì)算機(jī)視覺僅僅是圖像處理一個(gè)不成氣候的小領(lǐng)域,在像素級別怎么去做 filtering (such as low-pass, high-pass)、edge detection。但是,Jitendra 是最早一批看到了視覺本身在智能這個(gè)問題上的重要性。如果你看人,視覺是人類智能的重要的部分。所以,Jitendra 和與他同時(shí)代的一些研究者,比如 Shimon Ullman、Tomaso Poggio,一起推動了計(jì)算機(jī)視覺思維方式的改革。我 2000 年開始從事計(jì)算機(jī)視覺博士研究的時(shí)候,很幸運(yùn)的成為第一批趕上這股新思想的人,剛好開始用機(jī)器學(xué)習(xí)的思路來重新思考計(jì)算機(jī)視覺里重要的感知和認(rèn)知的問題。所以,Michael Jordan,Geoff Hinton 還有 Jitendra Malik,我覺得這三個(gè)人是對我影響最深的三個(gè)人。
AI 投資領(lǐng)域火熱,李飛飛給投資者的幾點(diǎn)建議
Q:您認(rèn)為未來 5 到 10 年 AI 最有可能會實(shí)現(xiàn)哪些突破?
李飛飛:我是這樣看的,任何一個(gè)即是基礎(chǔ)科學(xué)又是應(yīng)用科學(xué)的科學(xué)領(lǐng)域,提到 5 到 10 年的突破,我們得看是應(yīng)用場景的突破還是基礎(chǔ)科學(xué)的突破,這兩者往往是有聯(lián)系,但不一定一樣的。在我看來,基礎(chǔ)科學(xué)的突破應(yīng)該比應(yīng)用場景的突破早走幾步。
Q:您覺得目前投資領(lǐng)域在 AI 方面有泡沫嗎?您對 AI 投資者有什么建議?
李飛飛:要是一年前問我這個(gè)問題,我可能只能告訴你我完全不懂投資。但是,最近看到新聞,AI 投資十分火熱,同時(shí),硅谷的一個(gè)比較優(yōu)秀的投資團(tuán)隊(duì) A16Z 邀請我成為他們的顧問,Andreessen Horowitz 也被邀請作為他們的顧問。所以,我在最近的大半年開始學(xué)習(xí)投資了,雖然還是懂得非常少。我的感受是這樣的,我認(rèn)為大家對 AI 的熱情是真實(shí)的,一方面是由一個(gè)新興的領(lǐng)域帶來的興奮,另一方面是很多有遠(yuǎn)見的人看到了,我自己就非常相信,信息革命的后半段就是由 AI 來引領(lǐng)的。
信息革命的前半段是由 PC 和互聯(lián)網(wǎng)定義的,它帶來了數(shù)據(jù),信息革命的后半段是由智能來引領(lǐng)的。所以,從這個(gè)角度講,我是認(rèn)同這種興奮和關(guān)注的。你提到“泡沫”這個(gè)詞,我認(rèn)為可能在這種興奮和關(guān)注之間,有時(shí)候會有一些不冷靜?,F(xiàn)在在投資界大家也說,什么公司都想把自己標(biāo)榜成一家機(jī)器學(xué)習(xí)公司、一家大數(shù)據(jù)公司,但如果你仔細(xì)地看一下這個(gè)公司,它的人才、實(shí)力也許還沒有走到那一步。所以我建議投資人,用投資界的朋友說的話就是,“Due diligence”一定要做好,面對每一家公司的時(shí)候,不要只看PPT,去了解一下它們的工程師,它們的技術(shù)領(lǐng)導(dǎo)團(tuán)隊(duì)有什么樣的AI、機(jī)器學(xué)習(xí)或大數(shù)據(jù)的背景。這個(gè)是很重要的。
Q:您十月份沒有辦法到我們世界人工智能大會的現(xiàn)場,在這里有什么想對參會的各位說的嗎?
李飛飛:謝謝大家給我這個(gè)機(jī)會。首先我預(yù)祝人工智能世界大會的成功。在這個(gè)比較重要的歷史時(shí)刻辦這么一場會,我覺得也是一個(gè)非常好的機(jī)會,讓社會各界的人聚到一起,共同討論。我自己站在人工智能的科研者的角度,非常非常高興社會現(xiàn)在這么關(guān)注人工智能,我希望大家給我們很多反饋和建議,很多新的思路。我也希望我的學(xué)生今后不管是在學(xué)術(shù)界還是研發(fā)界還是創(chuàng)業(yè)界,都能有很好的機(jī)會。
我最近一直在思考 AI 何去何從的問題。你看現(xiàn)在好像 AI 不存在何去何從的問題,已經(jīng)是大家都非常關(guān)注的一個(gè)領(lǐng)域了。但我自己還是希望科技是為人類服務(wù)的,也就是說“technology has to be benevolent”,要站在人性的角度去思考技術(shù)。我也希望創(chuàng)投界和學(xué)術(shù)界更加關(guān)心人工智能的使命,人工智能最終的使命是以人為本的,當(dāng)你在想應(yīng)用場景的時(shí)候,不管是醫(yī)療、教育、交通、智能城市……我希望 AI 能用在提高人類生活品質(zhì)這些最關(guān)鍵的應(yīng)用場景。同時(shí)我也關(guān)注 AI 人,我希望更多的不同的人參與 AI 領(lǐng)域的發(fā)展。科技是帶著價(jià)值觀的,科技工作者會把他們的價(jià)值觀帶入科技中。那這些科技者是誰,就成了非常重要的一個(gè)問題,只有一種人群來創(chuàng)造科技往往會帶著這種人群的偏見。所以,我特別推崇包含很多不同的人,來自不同的生活背景、不同的膚色、不同的性別、不同的人生理念來參與 AI 科技的發(fā)展。?