高性能人工智能與視頻處理芯片解決方案提供商瀚博半導(dǎo)體(上海)有限公司(下稱“瀚博半導(dǎo)體”或“瀚博”)7月7日在2021世界人工智能大會(huì)期間發(fā)布其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡,這款通用推理加速卡可實(shí)現(xiàn)深度學(xué)習(xí)應(yīng)用超高性能、超低延時(shí)的推理性能,可顯著降低數(shù)據(jù)中心與邊緣智能應(yīng)用的部署成本。據(jù)悉,SV100系列及VA1通用推理加速卡預(yù)計(jì)會(huì)上發(fā)布的兩款新產(chǎn)品將于2021年今年四季度量產(chǎn)上市。
人工智能行業(yè)隨著持續(xù)的技術(shù)演進(jìn),算法模型的精度、性能等關(guān)鍵指標(biāo)在眾多領(lǐng)域不斷取得突破性進(jìn)展,已進(jìn)入算法規(guī)?;瘧?yīng)用落地階段。全球范圍內(nèi)各行業(yè)數(shù)據(jù)中心對(duì)推理算力的需求在快速增長,下游客戶多樣化的算力應(yīng)用場(chǎng)景,催生了多樣化的AI計(jì)算加速芯片需求,然而市面上卻鮮有主流GPU廠商外的其他更優(yōu)解決方案。基于對(duì)行業(yè)產(chǎn)品技術(shù)需求的洞察及顯而易見的巨大市場(chǎng)機(jī)遇,經(jīng)過兩年多的技術(shù)論證與軟硬件一體化設(shè)計(jì),瀚博半導(dǎo)體重磅推出了專為云端數(shù)據(jù)中心而生的SV100系列芯片與VA1通用推理加速卡。
瀚博本次發(fā)布的SV100系列芯片性能強(qiáng)大優(yōu)異,單芯片INT8峰值算力超200 TOPS,深度學(xué)習(xí)推理性能指標(biāo)數(shù)倍于現(xiàn)有主流數(shù)據(jù)中心GPU,具有超高吞吐率、超低延時(shí)的特性。瀚博自研的通用架構(gòu),為各種深度學(xué)習(xí)推理負(fù)載極致優(yōu)化。 此次推出的SV100系列芯片支持FP16, BF16和INT8等數(shù)據(jù)格式,并可以實(shí)現(xiàn)眾多主流神經(jīng)網(wǎng)絡(luò)的快速部署及計(jì)算機(jī)視覺、視頻處理、自然語言處理和搜索推薦等多樣化推理應(yīng)用場(chǎng)景。同時(shí)集成高達(dá)64路以上H.264/H.265/AVS2的1080p視頻解碼,廣泛適用于云端與邊緣智能應(yīng)用場(chǎng)景,在應(yīng)用中能夠提升客戶的設(shè)備資產(chǎn)效益、降低運(yùn)營成本。
瀚博半導(dǎo)體此次在這次發(fā)布會(huì)上同步推出的基于SV100系列芯片的VA1推理加速卡,為單寬半高半長75瓦PCIe x16卡,支持32GB內(nèi)存和PCIe 4.0高速接口協(xié)議,無需額外供電,即可適用于所有廠商的人工智能服務(wù)器,實(shí)現(xiàn)數(shù)據(jù)中心高密度高算力部署。
瀚博半導(dǎo)體創(chuàng)始人兼CEO錢軍表示:“SV100系列產(chǎn)品是所有瀚博人的心血結(jié)晶,我為我們的團(tuán)隊(duì)感到無比驕傲!我們深度了解行業(yè)客戶對(duì)吞吐量、延遲、通用性和成本的需求。同時(shí),向前兼容性非常重要,我們的軟件棧具有極高靈活性與可擴(kuò)展性,能夠支持未來新興算法模型和用戶自定義算子擴(kuò)展等。另一方面,占據(jù)過半中國AI應(yīng)用市場(chǎng)的計(jì)算機(jī)視覺應(yīng)用需要高密度的視頻解碼算力配合AI算力實(shí)現(xiàn)端到端的計(jì)算加速,在兩者之間的算力配比平衡方面,我們也做了大量的工作。瀚博通過前期核心技術(shù)積累和前瞻性布局,正式發(fā)布我們性能優(yōu)異的SV100系列云端通用AI推理芯片和VA1推理卡,可有效應(yīng)對(duì)上述低延時(shí)、通用性和視頻處理等方面的行業(yè)痛點(diǎn),推進(jìn)云端與邊緣的智能應(yīng)用落地?!?/p>
瀚博半導(dǎo)體創(chuàng)始人兼CTO張磊表示:“SV100系列芯片基于先進(jìn)的DSA架構(gòu),相同功耗下實(shí)現(xiàn)數(shù)倍于數(shù)據(jù)中心GPU的最高深度學(xué)習(xí)推理性能。同時(shí)支持計(jì)算機(jī)視覺、自然語言處理、搜索推薦、智能視頻處理領(lǐng)域的眾多常用神經(jīng)網(wǎng)絡(luò),軟件棧支持靈活擴(kuò)展,支持用戶自定義算子。VA1推理卡采用75W單寬半高半長設(shè)計(jì),可無縫適配各種人工智能服務(wù)器,最大化算力部署密度。我們的VastStream軟件平臺(tái)支持TensorFlow, PyTorch, Caffe2等常見的深度學(xué)習(xí)框架模型與ONNX格式的模型,通過高度定制的AI編譯器充分優(yōu)化模型在瀚博硬件上的執(zhí)行效率。 我們的軟件棧完備,同時(shí)提供了符合行業(yè)開發(fā)者使用習(xí)慣的工具,方便使用者以極低成本向瀚博硬件平臺(tái)遷移、部署現(xiàn)有算法應(yīng)用?!?/p>