今天下午,寒武紀在上海舉辦2018產(chǎn)品發(fā)布會,正式發(fā)布了新一代終端 IP 產(chǎn)品,采用7nm工藝的終端芯片Cambricon 1M、首款云端智能芯片MLU100以及搭載了MLU100的云端智能處理計算卡。
發(fā)布第三代終端AI芯片寒武紀1M
寒武紀在會上發(fā)布了第三代機器學習終端處理器1M,其性能比此前發(fā)布的寒武紀1A高10倍。配置方面,寒武紀1M使用臺積電7nm工藝生產(chǎn),其8位運算效能比達5 Tops/watt(每瓦 5萬億次運算)。寒武紀提供了2Tops、4Tops、8Tops三種尺寸的處理器內(nèi)核,以滿足不同場景下不同量級智能處理的需求,寒武紀稱,用戶還可以通過多核互聯(lián)進一步提高處理效能。
寒武紀1M處理器除了與上兩代芯片一樣支持CNN、RNN、SOM 等多種深度學習模型,還增加了SVM、k-NN、k-Means、決策樹等經(jīng)典機器學習算法的加速。
寒武紀創(chuàng)始人陳天石表示,寒武紀1M是全球第一款支持本地機器學習訓練的智能處理器產(chǎn)品,可為視覺、語音、自然語言處理等任務提供高效計算平臺,同時可以應用于智能手機、智能音箱、攝像頭、自動駕駛等不同領域。
推出首款云端AI芯片MLU 100
除了在終端芯片上布局,寒武紀還發(fā)布了Cambricon MLU 100云端AI芯片,以及云端智能處理計算卡(PCIe接口)。
據(jù)悉,MLU100采用寒武紀最新的MLUv01架構和臺積電16nm工藝,可工作在平衡模式(主頻 1Ghz)和高性能模式(主頻1.3GHz)兩種不同模式下,等效理論峰值速度則分別可以達到128萬億次定點運算和166.4萬億次定點運算,而其功耗為80w和110w。
寒武紀表示,MLU100云端芯片同樣具備高通用性,可支持各類深度學習和常用機器學習算法。陳天石宣稱,MLU100的功耗僅為是英偉達同類產(chǎn)品的幾分之一,將樹立新的行業(yè)標桿。
在發(fā)布會上,一些合作伙伴還展示了基于寒武紀芯片的部分應用方案。其中聯(lián)想推出了基于 Cambricon MLU100的服務器ThinkSystem SR650。中科曙光也推出了基于 Cambricon MLU100 的服務器產(chǎn)品系列PHANERON。科大訊飛也在發(fā)布會上披露了與寒武紀的深度合作研發(fā)項目。
打造端云協(xié)作,寒武紀彌補了中國芯片關鍵缺陷
在發(fā)布會上,寒武紀還提出了“端云協(xié)作”的理念,也就是說,MLU100云端芯片可以和寒武紀1A/1H/1M系列終端處理器進行適配,協(xié)同完成復雜的智能處理任務。
陳天石在接受采訪時表示,端側(cè)的智能處理可以最快速的響應用戶的需求,能以非常低的功耗、非常低的成本、非常小的延遲,幫助用戶理解圖像、視頻、語音和文本。但是,云側(cè)的智能處理可以把很多端的信息匯聚在一起。比如,在一個城市中有大量的攝像頭,如果想要知道一個特定的物體在多個攝像頭間的運動軌跡,就需要在云側(cè)進行智能處理。另外,終端的數(shù)據(jù)量有限,只能根據(jù)單個用戶的數(shù)據(jù)對機器學習模型進行微調(diào),而云可以看到大量用戶的數(shù)據(jù)。因此,端云協(xié)作的方式可以更大地發(fā)揮各自的長處,達到更好的效果。
早在2017 年底,在寒武紀首次舉辦的發(fā)布會中,就公開了公司的產(chǎn)品布局和線路,重點圍繞終端和云端兩條產(chǎn)品線。陳天石當時表示,未來三年寒武紀要占據(jù)中國高性能芯片30%的市場份額,并使得全世界10億臺以上的智能終端集成寒武紀處理器,打造中國主導的高性能芯片新生態(tài)。
分析指出,在中國AI計算領域,寒武紀扮演了極為重要的角色,其完全自有,可通用的平臺化 AI計算架構,契合了中國的計算核心發(fā)展需求。