越來越多的企業(yè)投身于人工智能轉(zhuǎn)型的浪潮中,但也有越來越多的企業(yè)意識到僅僅依靠自己的力量去實現(xiàn)技術(shù)創(chuàng)新,不僅過程困難,而且十分漫長,在這種背景下,人工智能領(lǐng)域的企業(yè)之間正在努力建立一種良好的互動關(guān)系,形成互相借力的產(chǎn)業(yè)生態(tài)圈。依托復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院運行的上海視頻技術(shù)與系統(tǒng)工程研究中心,作為人工智能“產(chǎn)研合作”的代表,以其聚焦的基于深度學(xué)習(xí)研究視覺內(nèi)容識別技術(shù),加速AI企業(yè)的創(chuàng)新應(yīng)用的落地。本次邀請該研究中心的薛向陽教授,為我們共同探討產(chǎn)研合作中存在的問題。
Q:a&s總經(jīng)理、總編輯 關(guān)玉娟
A:復(fù)旦大學(xué)計算機學(xué)院視頻技術(shù)與系統(tǒng)工程研究中心 薛向陽博士
關(guān)玉娟:你們研究的主要范疇是什么?有哪些應(yīng)用已經(jīng)開始落地?
薛向陽博士:我們中心主要從事視覺內(nèi)容識別研究,比如說辨識圖像中出現(xiàn)的物體、檢測該物體在圖像中所處位置等,都屬于最基本的計算機視覺任務(wù)。再復(fù)雜一點的任務(wù)便是挖掘物體與物體之間的關(guān)系,例如在一個特定場景的圖像中,根據(jù)某物體上下文信息,可推斷出其他可能存在的物體等。再進一步,可以用幾句話簡要描述一副圖像的主要內(nèi)容。目前視覺內(nèi)容識別距離實現(xiàn)人們所期望的各種需求,仍然有不小距離,當(dāng)前成功應(yīng)用主要是集中在特定物體的識別,例如人臉識別、車輛及車牌識別等,其他更復(fù)雜的應(yīng)用還處于實驗研究階段。
除了車輛與人臉等特定物體識別之外,值得一提的還有工業(yè)視覺領(lǐng)域的發(fā)展。例如地鐵、高鐵等路軌及設(shè)施等運行安全檢測,人力已經(jīng)無法負荷,通過視覺檢測等綜合技術(shù)手段,能有效地掌握列車及鐵軌的真實情況,及時處理問題,保證車輛安全行駛。
關(guān)玉娟:研究中心主要是負責(zé)完成企業(yè)委托或者針對合作項目進行研究嗎?
薛向陽博士:因為實驗室研究成果必須經(jīng)過實踐檢驗才能證明其有效性,所以我們跟企業(yè)的合作比較多,與企業(yè)緊密合作也是推動我們自身發(fā)展的重要外部條件?,F(xiàn)在,我們許多研究方向也是企業(yè)提出來的,是根據(jù)企業(yè)面臨的實際問題開展研究。社會上很多企業(yè)的研發(fā)力量是有限的,所以產(chǎn)研合作已經(jīng)是非常普遍的模式,在合作中我們主要是為企業(yè)提供算法模型的設(shè)計、算法模型性能優(yōu)化等知識服務(wù)。
關(guān)玉娟:團隊的優(yōu)勢是什么,以及合作對象主要是哪些類型的企業(yè)?
薛向陽博士:我們的優(yōu)勢一是算法模型設(shè)計,二是充沛的學(xué)生人才實力,企業(yè)具有熟悉場景與應(yīng)用落地的優(yōu)勢,同時他們具備市場及工程開發(fā)人員,能實現(xiàn)算法向產(chǎn)品的升級,通過合作互補實現(xiàn)各自資源的最優(yōu)配置,快速實現(xiàn)創(chuàng)新應(yīng)用。
關(guān)玉娟:市場關(guān)于視覺識別目前的應(yīng)用處于怎樣的水平?如何看待未來的發(fā)展?
薛向陽博士:人類感受外部環(huán)境信息的70%-80%來自視覺,因此視覺識別的應(yīng)用必然是范圍廣泛的,從應(yīng)用的成熟度而言,有些應(yīng)用已經(jīng)非常成熟,比如人臉識別,但也有一些應(yīng)用仍然不太成熟。很多識別的算法模型都是與具體應(yīng)用場景密切相關(guān),很難從一個應(yīng)用場景直接遷移到另一個應(yīng)用場景。
關(guān)玉娟:對于企業(yè)而言,與你們類似的機構(gòu)合作,時間成本優(yōu)勢明顯嗎?
薛向陽博士:對于一些大企業(yè)而言,他們可以對算法研究進行大的投入,但對于中小企業(yè)而言成本壓力很大。我們這類科研機構(gòu)對于企業(yè)而言是一種資源池,能幫助他們緩解成本壓力,而且?guī)椭麄冿@著提升技術(shù)水平。
關(guān)玉娟:與國外相比,您如何看待國內(nèi)AI應(yīng)用的水平?
薛向陽博士:從應(yīng)用層面而言,國內(nèi)技術(shù)水平接近國外,之所以不談領(lǐng)先,是因為AI里面很多的開源工具、平臺、芯片都是舶來品,但目前中國正在縮短與國外的差距,甚至在某些特定應(yīng)用場景中處于領(lǐng)先地位?;氐郊夹g(shù)研究層面,由于許多客觀的因素,目前仍然處于相對落后的狀態(tài)。
關(guān)玉娟:AI在實際應(yīng)用中最大的問題與困擾是什么?
薛向陽博士:AI依賴于應(yīng)用場景,只要場景確定(即各種邊界條件確定),這個時候研發(fā)人員比較容易將應(yīng)用性能等調(diào)整得很好。但如果更換了一個場景,原來那套方法就需要進行再調(diào)整,這也反映出AI算法模型泛化能力不夠,主要以定制化為主,限制了大范圍推廣。同時,當(dāng)前許多AI算法都是數(shù)據(jù)驅(qū)動的,需要持續(xù)收集大量特定應(yīng)用場景的數(shù)據(jù),然后在應(yīng)用中進行持續(xù)迭代優(yōu)化,這個過程所需人力與物力對于許多企業(yè)而言,顯然是一個非常大的技術(shù)、成本和運維等綜合壓力。
關(guān)玉娟:隨著人工智能等新技術(shù)的興起,目前在高校教育的師資力量匹配上是否會出現(xiàn)壓力?
薛向陽博士:以人工智能為例,在學(xué)校里很早便有相關(guān)的研究,只是之前并沒有獲得社會公眾普遍關(guān)注,比如計算機視覺、自然語言處理、模式識別、自動控制等都有相應(yīng)的師資和專業(yè),現(xiàn)在AI非常熱,全社會就更加重視,國家教育部先后設(shè)立了智能科學(xué)與技術(shù)、人工智能等本科專業(yè),國內(nèi)已有不少高校將計算機、電子工程、自動化、神經(jīng)科學(xué)、認知科學(xué)等專業(yè)進行人力資源整合,建立了人工智能學(xué)院或人工智能研究院,積極應(yīng)對社會對AI人才的急需。
關(guān)玉娟:接觸過這么多的人工智能企業(yè),您如何看他們在應(yīng)用方面的發(fā)展問題?
薛向陽博士:以我選擇合作的企業(yè)標(biāo)準而言,我認為要做好一個AI產(chǎn)品或應(yīng)用需要具備許多要素,首先是團隊要素,企業(yè)應(yīng)有足夠的數(shù)據(jù)工程師(負責(zé)人工數(shù)據(jù)標(biāo)注)、軟件工程師(負責(zé)工程代碼開發(fā))等。如果企業(yè)不具備這些開發(fā)人員,我們作為算法研究的角色是無法通過算法幫他們完成產(chǎn)品開發(fā)的。在實驗室環(huán)境下完成的算法,僅僅是作為算法思想,接下來企業(yè)要把算法思進行工程化實現(xiàn),并在實際應(yīng)用數(shù)據(jù)上進行持續(xù)檢驗。否則的話,雙方合作是很難取得讓人滿意的結(jié)果。
編后語:
人工智能未來充滿著無限可能,當(dāng)下人臉識別帶給了人們生活上極大的便利。要進一步促進人工智能的發(fā)展,需要源源不斷的創(chuàng)新動力。除了企業(yè)努力之外,還需要不同研究領(lǐng)域的專家開展跨學(xué)科合作研究,以應(yīng)對人工智能深入發(fā)展帶來的各種新挑戰(zhàn)。對人工智能企業(yè)而言,產(chǎn)學(xué)合作能使效率更高,成本降低,技術(shù)水平提升,加速推進惠澤社會的人工智能項目的不斷落地。