a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺

公眾號

安全自動化

安防知識網(wǎng)

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應(yīng)用搜索

首頁 > 資訊 > 正文

依圖科技創(chuàng)始人談AI未來的發(fā)展

2017-11-22 10:57 閱讀 3218 來源：中國網(wǎng) 評論區(qū)

依圖科技創(chuàng)始人談AI的未來

　　AI時代到來，如何對AI技術(shù)和產(chǎn)業(yè)發(fā)展更好更全面的理解?國內(nèi)知名人工智能公司依圖科技的聯(lián)合創(chuàng)始人朱瓏先生給出了他的觀點。

　　我是Leo，依圖科技聯(lián)合創(chuàng)始人，UCLA統(tǒng)計學(xué)博士，從事人工智能研究15年。曾在深度學(xué)習(xí)奠基者Yann LeCun教授實驗室擔(dān)任研究員，2010年獲得PASCAL圖像目標(biāo)檢測比賽冠軍，2017年獲得美國國家標(biāo)準(zhǔn)與技術(shù)研究院NIST和美國國家情報高級研究計劃局IARPA人臉識別全球冠軍。

　　最近，大量關(guān)于人工智能的研究報告，投資人、創(chuàng)業(yè)者、學(xué)者熱議AI的趨勢和對社會各行業(yè)的影響，不乏對AI技術(shù)和產(chǎn)業(yè)發(fā)展的誤解，很容易有誤導(dǎo)性。

　　宏觀上，我覺得這個議題大體分為三個方面：AI是多大的事?誰是真正的AI player?AI的場景在哪里?

　　作為科學(xué)研究者和創(chuàng)業(yè)者，從雙視角談?wù)勎业闹饕^點：

　　AI的邊界，只有領(lǐng)軍人物才可能準(zhǔn)確把握和拓展;

　　頂尖企業(yè)，因為遠(yuǎn)見造就勢能;

　　AI的未來，無與倫比，沒有歷史可以借鑒，也沒有權(quán)威可以預(yù)測。

　　“S”曲線看AI格局

　　我對AI發(fā)展歷史和預(yù)測，可以用上圖的”S”形曲線建模(Sigmoid函數(shù)，恰好也是用來刻畫神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的activation function)。其中橫軸表示時間，縱軸表示機器智能水平。曲線上的點表示某個時間點的全球最高智能水平。2013年開始是新AI時代(深度學(xué)習(xí))，2013年前的機器智能發(fā)展水平相較于近5年的發(fā)展基本可以忽略不計。紅線代表悲觀派(AI退潮、AI泡沫等)，2017年之后很快出現(xiàn)發(fā)展停頓;藍(lán)線代表樂觀派，2017年之后還有快速發(fā)展。

　　值得強調(diào)的是，藍(lán)紅兩條曲線對AI歷史有相同認(rèn)識，但市場上很多論調(diào)或研究報告看到的是另一條曲線，很大概率調(diào)研看到的AI水平離最高水平有很大差距。

　　分析AI格局的不同立場，可以通過解讀S曲線的三個方面：

　　1、AI過去的發(fā)展以及AI未來發(fā)展程度和速率的預(yù)測

　　2、AI發(fā)展水平和商業(yè)場景的關(guān)系

　　3、各個player的所在位置和差距

　　具體來說，我們先從AI過去5年的發(fā)展情況談起，以人臉識別作為例子，把人臉從N個人中找到的概率在95%，縱軸就是可識別的規(guī)模(N的大小)。

　　技術(shù)不是趨同，而是會放大差距、解鎖場景

　　2017年人臉識別最高水平可識別規(guī)模在20億人，大概比2016年可識別千萬提高兩百倍，比2015年提高了數(shù)萬倍。在2017年全球最權(quán)威的人臉識別測試中(NIST)，我們比第二名Vocord團隊，在千萬比對測試上領(lǐng)先2%(Vocord在另一測試集比騰訊優(yōu)圖高10%)，這個就是大家常說的技術(shù)水平趨同，高一兩個百分點沒有意義(引申出難兌現(xiàn)成競爭價值)。

　　這個誤區(qū)需要從兩個方面解讀：

　　第一方面，算法在億級、十億級比對的領(lǐng)先會快速放大到5%，20%。這是一般的算法性能曲線的規(guī)律。除了可識別規(guī)模上的重大差異，還體現(xiàn)在難(hard)的數(shù)據(jù)上的識別率差異。從算法經(jīng)驗來說，黑人、女性、小孩、大年齡跨度、遮擋等是較難識別的群體和類別。在這些子類上，不同算法之間的性能差異會更大。超大規(guī)模下的評測本身就是一個不簡單的學(xué)術(shù)命題，還需要大量的數(shù)據(jù)支撐，真正能觀測到20億數(shù)據(jù)下性能的人少之又少，例如美國很難建立20億級的測試集。這不是訪談一些人臉識別研究從業(yè)者就能獲得，這是誤區(qū)的第一個來源。

　　第二方面，算法提高，擴大可識別規(guī)模，就會解鎖更多商業(yè)應(yīng)用場景。百萬、千萬識別規(guī)模對應(yīng)的是身份認(rèn)證場景，遠(yuǎn)程認(rèn)證、手機解鎖都屬于此類?！凹夹g(shù)無差異”的論調(diào)在這個場景下倒是可以成立。但安防刑偵破案對億級和十億比對有剛性需求，在這些場景下，不是多識別出幾個罪犯的問題，而是找出來概率差別十倍以上的，幾乎就是行與不行的問題?！胺顷P(guān)鍵性應(yīng)用”的論斷誤導(dǎo)性極強。

　　在最新的安防案例中，萬路甚至十萬路攝像頭視頻的人臉?biāo)阉?、歸檔對算法有極高要求，假定每路人流為萬，要在萬路視頻中，搜索性能相當(dāng)于要求算法百億、千億規(guī)模上的可識別率。這比其他場景的性能要求再提高千倍。以不同算法為基礎(chǔ)的產(chǎn)品端體驗差異就被同比例放大。另外，全球人種的識別，是反恐、出入境業(yè)務(wù)對識別的覆蓋面要求是很很高的。

　　總結(jié)來說，99%識別率的算法和99.99%的算法，區(qū)別在于可解鎖的應(yīng)用場景。這些新的場景解鎖，是最先鋒的算法團隊和垂直領(lǐng)域的開拓者(比如公安系統(tǒng)的創(chuàng)新團隊)共同努力，也不是訪談一般的安防從業(yè)者就能感知變革的最前沿，這是誤區(qū)的另一個來源。

　　技術(shù)水平的三個層次VIE：Vision(遠(yuǎn)見)，Insight(洞見)，Execution(執(zhí)行)

　　技術(shù)實力該如何評估比較呢?最常見的是測試比賽的冠軍、實際案例、招投標(biāo)PK成績、論文等。這些或許能區(qū)分是不是前10名的AI團隊，但很難區(qū)分最好的團隊。我對技術(shù)的三層解構(gòu)：Vision，遠(yuǎn)見，或戰(zhàn)略格局、技術(shù)趨勢判斷;Insight，洞見，算法本質(zhì)和客觀世界分布規(guī)律的理解;Execution，執(zhí)行，算法實現(xiàn)、數(shù)據(jù)獲取、工程計算平臺等。

　　最基礎(chǔ)的Execution就是算法做到什么水平，特別是大體框架已知后，能快速實現(xiàn)，包括基礎(chǔ)算法、場景數(shù)據(jù)、計算實驗平臺、產(chǎn)品應(yīng)用等。比如，AlphaGo出來后，多快能復(fù)現(xiàn);語音識別多快能追上全球最好的結(jié)果。頂級的Execution，不是開源的算法平臺可以彌補。特定領(lǐng)域的專家能幫助團隊快速提高對應(yīng)領(lǐng)域Execution的水平。這個層面，中國團隊?wèi)?yīng)該是世界一流的。Google如果是世界第一的話，不論是下棋、人臉識別、語音識別等，中國的水平應(yīng)該不會比 Facebook、Microsoft、Apple、Amazon等差，甚至某些方面稍強些。大部人比較技術(shù)，基本就在這個層次。但更重要的、威力更大的是上面的兩個層次。

　　再往上一層是Insight，考察對技術(shù)的深刻認(rèn)知。包括算法模型的數(shù)學(xué)解釋、客觀世界分布規(guī)律的獨到見解。Insight指導(dǎo)如何使用數(shù)據(jù)、計算力(就是指導(dǎo)如何使用算法甚至創(chuàng)新算法)。這層決定能不能比Google做得更好，或者能保持同一發(fā)展節(jié)奏。假定擁有深度學(xué)習(xí)算法框架、海量數(shù)據(jù)在同樣水平，但是大家對算法性能調(diào)教還有巨大差距。以人臉識別為例，我們使用了2億張人臉圖片(幾十億張圖片的子集)訓(xùn)練，有效模型參數(shù)達(dá)到10億量級，利用對人臉這個對象的屬性先驗的合理假設(shè)，包括光照、年齡、種族、運動模糊、成像解析度等，模型定制、數(shù)據(jù)如何組合、計算如何加速在性能調(diào)優(yōu)和模型學(xué)習(xí)效率上(就是上面提到的Execution)都有重大差異。這就是為什么擁有算法、算力、數(shù)據(jù)條件的互聯(lián)網(wǎng)巨頭也不見得能在單項AI任務(wù)上能做到全球前三。

　　再就是Vision，預(yù)測發(fā)展趨勢、定義未來方向，想象對生活、生產(chǎn)的影響。這除了需要對技術(shù)的深刻理解，還需要對技術(shù)的創(chuàng)新能力，以及技術(shù)商業(yè)價值的想象力、創(chuàng)造力。技術(shù)的遠(yuǎn)見，回答AI的場景在哪以及多快到來。

　　強的Execution，Insight肯定不錯，但可能毫無Vision;最強的Vision，Insight肯定一流，但Execution可能很差。VIE都很強的團隊全球極其稀缺。

　　用深度學(xué)習(xí)領(lǐng)域最強的兩位大師Hinton和LeCun談一下我的感受。在2010年前，學(xué)術(shù)界不少人已經(jīng)在談大數(shù)據(jù)對機器學(xué)習(xí)的重要性，Hinton團隊2012年在LeCun發(fā)明的算法基礎(chǔ)上，用了百萬的訓(xùn)練數(shù)據(jù)，在ImageNet上取得世界級的突破性進展;同一時期，LeCun團隊只用了不到十萬的數(shù)據(jù)。但是在Hinton公布ImageNet結(jié)果的頭兩個月，LeCun團隊沒法重現(xiàn)Hinton用自己算法的實驗結(jié)果。在Hinton公布算法實現(xiàn)和技巧后，LeCun團隊的結(jié)果就輕松超過了Hinton團隊的水平。

　　兩位大師都擁有超一流的Vision，在深度學(xué)習(xí)方向上堅持三十年。但是他們Vision的差別以及以此帶來的信念差別使得Insight的差別(是否追求更深刻見解)在當(dāng)時可能是巨大的，對深度學(xué)習(xí)算法發(fā)揮的突破條件包括訓(xùn)練數(shù)據(jù)規(guī)模、模型正則化實現(xiàn)、activation function選取、GPU計算等的理解還有顯著差異。這些在當(dāng)時，原理還不清楚時，可能完全是憑著Hinton(包括那一期超強的博士生)的直覺。這種Insight的差距，使得LeCun團隊已知所用算法框架和目標(biāo)性能但未知關(guān)鍵實現(xiàn)時，也不能重現(xiàn)結(jié)果。但之后，LeCun團隊擁有更好的Execution(大規(guī)模系統(tǒng)性調(diào)優(yōu))，能在短時間內(nèi)算法性能超過。這種最牛高手間信念的微妙差異，到底來源于什么，值得深思。

　　為什么Vision很重要?就像雷達(dá)，對別人來說是盲區(qū)，Vision讓你看見，看見所以相信，相信所以平靜。不僅以此獲得戰(zhàn)略優(yōu)勢，還有定力，排除誘惑和干擾。

　　Vision如何辨別呢?非常難，甚至幾乎不可能，只能由同樣有Vision的人欣賞。就像taste難以打分一樣，只能由同樣有taste的人欣賞。Vision帶你看到的，就是99%的專家同行都看不到、不相信的。所以，偉大往往和誤解相伴。LeCun在深度學(xué)習(xí)被實際測試數(shù)據(jù)驗證前，也很難被美國主流學(xué)術(shù)圈認(rèn)可，甚至發(fā)表頂級會議都不是簡單的事，可如今，幾乎所有的論文都要貼上深度學(xué)習(xí)的標(biāo)簽。

　　但是判斷過濾沒有Vision的團隊，倒是有跡可循。一般來說，無論學(xué)術(shù)還是創(chuàng)業(yè)，偉大的突破，都需要多年前后一致的投入和深耕。隔年換領(lǐng)域或者什么模式都在做的(垂直、平臺等)，歸類為沒有Vision應(yīng)該沒什么問題。

　　有了VIE的拆解，我認(rèn)為，AI新時代的壁壘只有人，最頂級的人。領(lǐng)軍人物對AI技術(shù)和商業(yè)邊界的未來分布判斷無法替代，決定AI發(fā)展基本要素(算法、算力、數(shù)據(jù)和場景)的所需程度和權(quán)重。擁有頂級Execution和Insight的團隊，最知道對算法有效的數(shù)據(jù)在哪、如何標(biāo)注使用。擁有頂級Insight和Vision的團隊，最早知道技術(shù)的突破帶來最具商業(yè)價值的場景在哪以及何時到來。

　　AI未來：沒有歷史可以借鑒，也沒有權(quán)威能夠預(yù)測

　　談了AI發(fā)展，技術(shù)如何解構(gòu)，談?wù)凙I的未來?；谏疃葘W(xué)習(xí)的AI新時代，大大不同于30年歷史上的AI，這是被各種應(yīng)用、在實際場景、大規(guī)模數(shù)據(jù)驗證過性能的技術(shù)，而不只是理論或概念。盡管過去5年的發(fā)展，對得起人們的期待，今天，還有不少人擔(dān)心新AI像過去一樣很快會退潮。但我認(rèn)為，AI新時代只是開始。

　　我從新AI的三個特性簡要闡述：

　　1、AI是全新的維度。這是最重要的，決定AI到底是多大的事。

　　AI技術(shù)如何創(chuàng)新發(fā)展，如何變革商業(yè)，沒有歷史可以借鑒，也沒有權(quán)威能準(zhǔn)確判斷。AI不僅僅是一個技術(shù)，AI突破還能突破所有技術(shù)包括人機交互、搜索、機器人、芯片計算、醫(yī)學(xué)、制藥等科學(xué)領(lǐng)域的幾乎所有學(xué)科。

　　2、AI的發(fā)展速度快、跳躍性強

　　從S曲線中，可以看到過去5年，AI的發(fā)展及其迅猛，單門類(人臉識別)算法有了萬倍的增長。但我對未來更加憧憬，即S曲線中2018年之后的曲線有多陡。AI發(fā)展帶來的多維度技術(shù)和各場景深度結(jié)合、疊加會帶來更有沖擊力的體驗。從多技術(shù)維度來說，從視覺，到聽覺、語義理解、運動控制會在之后幾年都會快速突破;和芯片結(jié)合，端智能滲透到與用戶的最后30公分的交互體驗，從Internet Of Things向Internet Of Intelligence跨越，讓智能無處不在。

　　3、AI領(lǐng)先一步，會帶來巨大勢能

　　在S曲線中，處在不同位置的團隊，優(yōu)勢不只是橫軸時間的差距，而是技術(shù)領(lǐng)先帶來的累積效應(yīng)(曲線積分)以及更多元(多條AI技術(shù)曲線)AI技術(shù)的疊加，這使得AI能有跨行業(yè)的摧毀性。不僅僅決定某個行業(yè)，第一名和第二名的差距或位置關(guān)系，還能使得AI領(lǐng)先的行業(yè)的領(lǐng)導(dǎo)者撬動AI意識落后的行業(yè)。

　　AI未來，無與倫比;因為看見，所以相信。

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

上一篇

無人值守是智慧停車場必然的發(fā)展趨勢
下一篇

大華股份匠心打造“云上寧波” 創(chuàng)新助力數(shù)據(jù)強市

您可能也喜歡這些文章

參與評論

回復(fù)：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達(dá)個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務(wù)。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

依圖科技創(chuàng)始人談AI未來的發(fā)展