星光智能一號(hào)是中星微主導(dǎo)的“星光中國芯工程”的又一重大階段性成果,這標(biāo)志著我國在神經(jīng)網(wǎng)絡(luò)處理器領(lǐng)域的研究和開發(fā)上取得了重大突破;在基于“數(shù)據(jù)驅(qū)動(dòng)并行計(jì)算”架構(gòu)的深度學(xué)習(xí)人工智能領(lǐng)域達(dá)到國際先進(jìn)水平;使我國視頻監(jiān)控行業(yè)發(fā)展由模擬時(shí)代、數(shù)字時(shí)代跨入智能時(shí)代,實(shí)現(xiàn)產(chǎn)業(yè)化并促進(jìn)整體水平提升,在全球確立領(lǐng)先地位。
“星光智能一號(hào)”中國首款嵌入式神經(jīng)網(wǎng)絡(luò)處理器芯片誕生
從“深藍(lán)”到Alphgo,人工智能如何發(fā)展?
人工智能經(jīng)過了跌宕起伏的發(fā)展過程,從“深藍(lán)”對(duì)決國際象棋,到Alphago對(duì)戰(zhàn)圍棋九段李世石,人工智能都以勝者的姿態(tài)展現(xiàn)在世人面前。不過,兩次人機(jī)大戰(zhàn)背后的技術(shù)力量截然不同。第一次人機(jī)大戰(zhàn),“深藍(lán)”憑借的是超級(jí)計(jì)算機(jī)的運(yùn)算速度,而第二次人機(jī)大戰(zhàn)中,Alphgo依靠的卻是模仿人腦的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
然而,有一個(gè)問題擺在我們面前,深藍(lán)重達(dá)1270公斤,有32個(gè)CPU,而Alphago更是運(yùn)行在一個(gè)龐大的服務(wù)器集群上,每下一盤棋的電費(fèi)就高達(dá)3000元美金!深度學(xué)習(xí)只是大型服務(wù)器集群的專屬嗎?小型化設(shè)備能否集成深度學(xué)習(xí)系統(tǒng)?中星微國家重點(diǎn)實(shí)驗(yàn)室給出的答案是:前端小型化設(shè)備也可以擁有人工智能。
中星微數(shù)字多媒體芯片技術(shù)國家重點(diǎn)實(shí)驗(yàn)室執(zhí)行主任張韻東表示,神經(jīng)網(wǎng)絡(luò)處理器(NPU)針對(duì)CNN(卷積神經(jīng)網(wǎng)絡(luò),Convolutional Neural Network)算法特性而設(shè)計(jì)的處理器內(nèi)核,徹底顛覆了馮諾依曼架構(gòu)而采用了“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算架構(gòu)。
每個(gè)NPU處理器具有4個(gè)內(nèi)核(NPU Core),每個(gè)內(nèi)核有兩個(gè)數(shù)據(jù)流處理器(Dataflow Processor), 每個(gè)數(shù)據(jù)流處理器具有8個(gè)長位寬或16個(gè)短位寬的SIMD(單指令多數(shù)據(jù))運(yùn)算單元。在一個(gè)時(shí)鐘周期內(nèi),NPU處理器可同時(shí)完成64個(gè)長位寬MAC運(yùn)算或者128個(gè)短位寬MAC運(yùn)算。每個(gè)NPU處理器具有38G Ops的長位寬處理能力或者76G Ops的短位寬處理能力。
NPU的處理性能可以通過組成多核陣列來提升,也可以通過多芯片級(jí)聯(lián)的方式進(jìn)一步擴(kuò)展,以滿足更復(fù)雜的CNN網(wǎng)絡(luò)運(yùn)算的性能需求。每個(gè)NPU處理器中同時(shí)還包含一個(gè)LW Processor(長字處理器),專門用于處理神經(jīng)元網(wǎng)絡(luò)中的超越函數(shù)等復(fù)雜計(jì)算。另外,每個(gè)NPU處理器還具有256KB Level-2 Cache,以及整塊數(shù)據(jù)搬移(Block Data Access),片內(nèi)數(shù)據(jù)共享(Data-sharing Between Processor Units),提升數(shù)據(jù)流的吞吐效率。并與軟件配合利用了稀疏數(shù)據(jù)優(yōu)化(Optimization for Sparse Data)等特性提高計(jì)算效率。NPU開發(fā)包提供可視化的數(shù)據(jù)流程圖優(yōu)化工具。NPU支持Caffe、TensorFlow等多種神經(jīng)網(wǎng)絡(luò)框架, 支持AlexNet、GoogleNet等各類神經(jīng)網(wǎng)絡(luò)。
張韻東介紹說,星光智能一號(hào)的誕生,將人工智能與大數(shù)據(jù)產(chǎn)業(yè)有機(jī)結(jié)合在一起,成千上萬個(gè)視頻監(jiān)控設(shè)備所產(chǎn)生的數(shù)據(jù),通過前端智能分析、后端深度挖掘,能夠產(chǎn)生巨大的社會(huì)效益和經(jīng)濟(jì)價(jià)值。
“星光智能一號(hào)”芯片
從星光一號(hào)到星光智能一號(hào),芯片產(chǎn)業(yè)未來在何方?
在中國芯片產(chǎn)業(yè)發(fā)展史上,“中星微”是一個(gè)耀眼的名字。1999年,在原國家信息產(chǎn)業(yè)部的直接投資和領(lǐng)導(dǎo)下,以及財(cái)政部、科技部、國家發(fā)改委、北京市等有關(guān)部門的大力支持下,鄧中翰、楊曉東等一批來自美國硅谷的留學(xué)回國博士在北京中關(guān)村創(chuàng)立了中星微電子集團(tuán)。
2001年9月,百萬門級(jí)超大規(guī)模芯片“星光一號(hào)”實(shí)現(xiàn)產(chǎn)品化,并成功打入國際IT市場(chǎng),結(jié)束了中國無“芯”歷史。星光數(shù)字多媒體芯片系列產(chǎn)品,廣泛應(yīng)用于個(gè)人電腦、寬帶、移動(dòng)通訊、信息家電等領(lǐng)域,占據(jù)了全球計(jì)算機(jī)圖像輸入芯片60%以上的市場(chǎng)份額。有媒體將“星光一號(hào)”同神州飛船、水稻基因組并稱為20世紀(jì)90年代的重大科技成果,稱其“取得了一系列歷史性成就,書寫了新的輝煌篇章”。
中星微主導(dǎo)的“星光中國芯工程”,見證著中國芯片產(chǎn)業(yè)的發(fā)展,中星微成為中國第一家在美國納斯達(dá)克上市的集成電路設(shè)計(jì)企業(yè);牽頭制定的SVAC國家標(biāo)準(zhǔn)是世界上第一個(gè)專門用于安防監(jiān)控領(lǐng)域的視音頻編解碼標(biāo)準(zhǔn);公司創(chuàng)始人鄧中翰也成為我國第一位來自創(chuàng)業(yè)創(chuàng)新領(lǐng)域的兩院院士,同時(shí)也是最年輕的中國工程院院士。
從“星光系列”芯片,到“星光移動(dòng)系列”芯片,再到“星光智能一號(hào)”,中星微走過了十五個(gè)年頭。十五年風(fēng)雨無阻,十五年砥礪前行,中星微實(shí)現(xiàn)了幾代中國集成電路科技工作者的夢(mèng)想,是中國電子信息產(chǎn)業(yè)從“中國制造”邁向“中國創(chuàng)造”、引領(lǐng)國際市場(chǎng)的成功典范。
十余年來,中星微實(shí)現(xiàn)了九大核心技術(shù)突破,申請(qǐng)了3000多項(xiàng)國內(nèi)外專利,其中超過90%是發(fā)明專利,形成了完整的數(shù)字多媒體芯片技術(shù)體系,建立了國際認(rèn)可的PC圖像輸入國際標(biāo)準(zhǔn)和移動(dòng)應(yīng)用處理器MIPI國際標(biāo)準(zhǔn),開發(fā)出擁有自主知識(shí)產(chǎn)權(quán)、具有國際先進(jìn)水平的系列芯片,先后兩次獲得“國家科技進(jìn)步一等獎(jiǎng)”。
面對(duì)半導(dǎo)體行業(yè)發(fā)展面臨的瓶頸,中星微創(chuàng)新地提出了“智能摩爾(Intelligent Moore)”的發(fā)展路徑。張韻東表示,雖然物理層面和信號(hào)層面都受到摩爾定律的制約,但在信息層面的技術(shù)創(chuàng)新還遠(yuǎn)沒有達(dá)到極限。如何進(jìn)一步借鑒人腦生理機(jī)制,研究新型計(jì)算架構(gòu),提升信息處理的性能功耗比,可能是下一次信息革命的關(guān)鍵。
張韻東表示,在未來五年中,中星微會(huì)持續(xù)開展新型“數(shù)據(jù)驅(qū)動(dòng)”并行計(jì)算架構(gòu)的研究工作,采用更加接近生物人腦的工作機(jī)理的方式,推出更低功耗、更高運(yùn)算性能的下一代神經(jīng)網(wǎng)絡(luò)處理器。摩爾定律走到盡頭是客觀物理規(guī)律,但是通過人工智能的發(fā)展,信息處理效率的提升還大有可為。