AI不得不面對的難題
在上屆北京安博會上,讓人感覺不談人臉不好意思說自己來參展,而這屆徹徹底底變成不談AI都很難吸引觀眾的眼球。據(jù)了解在國內(nèi),阿里巴巴、海康威視、華為、大華股份、蘇州科達、宇視、東方網(wǎng)力、天地偉業(yè)等廠商已經(jīng)推出了覆蓋視頻分析、人臉識別、智慧交通等領(lǐng)域的安防解決方案,不斷讓GPU的強大處理能力滲透至城市安全的各個領(lǐng)域。
AI在安防落地雖然是趨勢,但目前也暴露出不少的問題,從技術(shù)角度而言有以下幾點:
其一,當前基于“CPU+GPU”的計算模型已經(jīng)被廣泛運用于各種深度學習中去,但其本質(zhì)而言,其實CPU與GPU均是利用相關(guān)成熟的技術(shù)提供一種通用級的解決方法來滿足深度學習的要求,雖然諸如英特爾(Intel)及英偉達(NVIDIA)不斷在推出新的加速芯片來完善自身的深度學習方案,但這也不能掩蓋其缺乏針對專業(yè)應(yīng)用解決方案的事實;
其二,當前深度學習的算法僅僅滿足于特定的理想場景,例如空間限制等,但同樣的產(chǎn)品放在不同場景下,其表現(xiàn)能力其實具有較強的局限性,這其中也有算法的困難,例如近距離與遠距離場景的差異等;
其三,能效問題,目前的深度學習模型訓練中,雖然可以實現(xiàn)一條指令實現(xiàn)大批數(shù)據(jù)的平行處理,但在平臺 完成訓練之后,需要進行的推理環(huán)節(jié)的計算,這部分卻跟前者完全不同,無法實現(xiàn)單指令完成。而據(jù)估計,未來有95%的深度學習將用于推理,只有不到5%的資源用于模型訓練,尋找低功耗、高性能的加速硬件成為當務(wù)之急。
FPGA能否彌補GPU的不足
在GPU方案無法滿足未來需求的情況下,人們逐漸把目光投向了“FPGA” (Field-Programmable Gate Array,即現(xiàn)場可編程門陣列)。但如果沒有深耕安防行業(yè)的相關(guān)方案,恐怕也會重蹈GPU之路??上驳氖窃诎卜佬袠I(yè)中,去年鮮見的該類型解決方案供應(yīng)商,今年在安博會上有了代表,一下子吸引了眾人的眼球——深鑒科技。
談起這家企業(yè),筆者也是陌生的,唯一的印象是在前不久螞蟻金服領(lǐng)投的融資信息上看過這家企業(yè)。帶著GPU存在的弊端及對其好奇心,采訪了深鑒科技創(chuàng)始人&CEO姚頌,探討FPGA在行業(yè)未來應(yīng)用的前景。
(1)深鑒是誰?能干什么?
“深鑒科技是一家清華系背景的深度學習解決方案開發(fā)商,其核心一是深度壓縮技術(shù)(Deep Compression),讓算法模型更小,延遲更短、功耗更少,二是DPU硬件設(shè)計能力,為深度學習提供端到端的軟硬件結(jié)合解決方案?!币灲榻B。
筆者在現(xiàn)場看到的產(chǎn)品包括網(wǎng)絡(luò)攝像機的板卡模組、以及針對NVR及服務(wù)器視頻結(jié)構(gòu)化及人臉識別的硬件方案等產(chǎn)品,姚頌介紹,深鑒主要解決的是人工智能平臺落地難的問題,其解決方案主要針對特定領(lǐng)域的計算需求進行體系結(jié)構(gòu)上裁剪和優(yōu)化設(shè)計,能夠使其獲得比通用處理器體系結(jié)構(gòu)更優(yōu)秀的性能、更高的能效。“當前攝像機會用到兩類平臺,一類是英特爾Movidius的DSP和ARM陣營,另一類是英偉達TX1/TK1 GPU,但前者性能不強,僅僅能完成簡單的算法,后者功耗太高。因此我們選擇了折衷的方式,讓智能化產(chǎn)品落地的同時保證性能、低功耗及穩(wěn)定性?!?/p>
(2)與之前的AI初創(chuàng)型企業(yè)有什么不同?
姚頌通過在核心能力的研究方向,總結(jié)深鑒的獨特性?!拔覀児靖M入到安防行業(yè)已經(jīng)有一段時間的商湯、曠視、依圖、云從的定位完全不同,他們的核心能力是算法設(shè)計能力,具體表現(xiàn)為它們的人臉識別算法在世界比賽取得的成績等等,這些是他們的核心能力。但深鑒核心的能力主要分為兩部分:一是算法壓縮,幫助客戶實現(xiàn)深度學習算法壓縮幾倍到幾十倍的服務(wù),用戶可以實現(xiàn)根據(jù)場景定義不同的算法,讓客戶減少前端的壓力,同時設(shè)備也能運行得更快;二是深度學習處理器的設(shè)計能力(DPU),我們在清華、斯坦福已經(jīng)積累了許多年芯片結(jié)構(gòu)/指令級的設(shè)計,能實現(xiàn)比GPU功耗要低于幾十倍,性能一樣的產(chǎn)品。“ 他認為深鑒與商湯、曠視及應(yīng)用設(shè)計企業(yè)之間是互補的關(guān)系,未來也定位在平臺公司,既不碰應(yīng)用,也不會進入到項目市場中去。以單純地提供模組服務(wù),幫助安防行業(yè)的企業(yè)繼續(xù)保持競爭優(yōu)勢。
(3)這會是直接對標英偉達嗎?
從某種程度上而言,芯片業(yè)巨頭英偉達曾率先推出深度學習軟件包 TensorRT,在深度學習算法推理階段能將GPU的計算能力更大程度釋放出來,相對簡單易用。而深鑒科技自主研發(fā)的DNNDK((Deep Neural Network Development Kit)),即對標英偉達的 TensorRT 產(chǎn)品。
“從整個產(chǎn)品的技術(shù)特點而言,我們的產(chǎn)品與英偉達確實有類似的地方,他們有GPU,我們有DPU,他們有TensorRT,我們有DNNDK,但我們在業(yè)務(wù)場景上是有區(qū)別的,英偉達的產(chǎn)品往往沒有具體細分到行業(yè)上,它提供的板卡既可以用于PC也可以用于監(jiān)控,沒有為行業(yè)定制方案,我們更加傾向于結(jié)合具體行業(yè),而不是以撒網(wǎng)的方式向所有行業(yè)布局?!币灲忉尅?/p>
(4)FPGA那么貴,安防會選擇嗎?
安防廠商對于FPGA的最初印象大都停留在價格昂貴及開發(fā)難度大的層面上,GPU的迅速發(fā)展也讓人們忘記了它的好處——靈活多變且功耗低,這也與當前行業(yè)興起的邊緣計算不謀而合,在看清GPU存在的問題之后,F(xiàn)PGA相信會獲得更多的關(guān)注。
據(jù)相關(guān)資料顯示,浪潮與Intel 于去年底FPGA加速卡 F10A 最高性能的加速卡,單芯片峰值運算能力達到1.5TFlops,功耗才35W,每瓦特功率42GFlops,是GPU的數(shù)倍之高。
“FPGA開發(fā)周期長,難度大,我們公司希望把這些問題都解決掉,所以我們軟件、模組等產(chǎn)品都非常的簡單易用,舉個例子只要有C++基礎(chǔ)的人,基本一周之內(nèi)能學會使用我們的工具鏈,可以做自己的算法意識。由于深鑒會統(tǒng)一提供深度學習的模組方案,客戶便不再需要單獨購買FPGA,加上賽靈思(Xilinx,世界最大的FPGA芯片廠商)也是我們的投資方,得到他們的支持,客戶最終拿到的價格也會比較合理。在解決了簡單易用及價格因素的問題之后,用戶自然沒有選擇的困難性?!币灮卮稹?/p>
FPGA與GPU公司在風格上也存在著異同,這點類似于傳統(tǒng)企業(yè)與互聯(lián)網(wǎng)企業(yè)一樣,前者較為保守(喜歡把雞蛋放在多個籃子),后者往往更加激進(喜歡孤擲一注),因此后者在產(chǎn)品的更新速度上往往會比前者更快。賽靈思看到這點的不足,于是選擇了投資深鑒科技,讓其不僅在芯片設(shè)計能力上進行優(yōu)化,也通過模型壓縮的方式,實現(xiàn)更天然有效的方式去快速迭代。
(5)完成融資后,有什么規(guī)劃?
近期,深鑒科技完成4000萬美元的A+輪融資。而現(xiàn)在,它也出現(xiàn)在安博會上,這也意味這個新面孔必然會在行業(yè)內(nèi)“搞事情”。
對于融資后的規(guī)劃,姚頌表示未來將從兩個方面強化在安防行業(yè)的布局:一是通過團隊建設(shè),摸清行業(yè)脈路,真正讓企業(yè)扎根進入行業(yè)中來,讓人工智能在安防的落地更高效率;二是實現(xiàn)芯片在未來三年的更新?lián)Q代計劃,如明年上半年我們會推出第一套基于自身研發(fā)的聽濤芯片方案,下半年便會計劃推出迭代第二代芯片,實現(xiàn)服務(wù)的升級。
(6)如何合作,技術(shù)要求如何
對于合作方面,姚頌表示深鑒因為自身定位非常清晰——人工智能加速方案提供商,既不做設(shè)備和集成,也沒有計劃做政府如智慧城市等項目。希望通過提供方案,跟更多安防廠商合作,實現(xiàn)人工智能在各個場景運用起來。
姚頌介紹,開發(fā)技術(shù)能力較弱的企業(yè)只需提供調(diào)試接口,便能產(chǎn)品從軟到硬實現(xiàn)人工智能。而具有開發(fā)能力的企業(yè),也可以通過深鑒的軟件,將自己算法與運用更好結(jié)合起來。
百花齊放才是春
對于當前AI方案的選擇性上,各家技術(shù)大同小異。而FPGA的出現(xiàn)也能讓其落地更加的高效、靈活、低功耗、低成本,必然能讓行業(yè)的AI化更別具一番風采,這或許是未來一年安防行業(yè)最重大的變化。