當前主流的AI芯片主要分為三類,GPU、FPGA、ASIC。其中GPU、FPGA均是前期較為成熟的芯片架構,屬于通用型芯片。ASIC屬于為AI特定場景定制的芯片。
GPU(圖像處理單元):GPU最初承擔圖像計算任務,能夠進行并行計算,因此GPU架構本身比較適合深度學習算法,通過對GPU的優(yōu)化,進一步滿足深度學習大量計算需求。其主要缺點在于功耗較高。
FPGA(FieldProgrammableGateArray,現場可編程門陣列):FPGA,具有足夠的計算能力、較低的試錯成本和足夠的靈活性。FPGA的計算速度快是源于它本質上是無指令、無需共享內存的體系結構。對于保存狀態(tài)的需求,FPGA中的寄存器和片上內存(BRAM)是屬于各自的控制邏輯的,無需不必要的仲裁和緩存,因此FPGA在運算速度足夠快,優(yōu)于GPU。同時,相比量產成本高昂的ASIC芯片,因為它是一種半定制的硬件,通過編程可定義其中的單元配置和鏈接架構進行計算,因此在靈活性上優(yōu)于ASIC,具備較低試錯成本。
ASIC(ApplicationSpecificIntegratedCircuit特定用途集成電路):根據產品的需求進行特定設計和制造的集成電路,能夠在特定功能上進行強化,具有更高的處理速度和更低的能耗。缺點是成本高,且由于是定制化,可復制性一般,因此只有用量足夠大時才能夠分攤前期投入,降低成本。