據(jù) tom'sHardware 報道,Tachyum 創(chuàng)造了世界上最強大的處理器之一:Prodigy T16128 通用處理器。Prodigy T16128 擁有 128 個 64 位 CPU 內(nèi)核,運行頻率高達 5.7GHz,還有 16 個 DDR5 內(nèi)存控制器和 64 個 PCIe 5.0 通道,可以處理通用計算、高性能計算 (HPC) 和 AI 工作負載 —— 所有這些都使用單個芯片。
Tachyum 將 Prodigy 稱為世界上第一個“通用處理器”,并表示從一開始就被設(shè)計為能夠運行眾多世界上最密集的計算應(yīng)用程序的多用途 CPU。Prodigy 不僅在單個芯片上處理所有這些不同的任務(wù),而且功耗預(yù)算比傳統(tǒng)硬件降低到 10 分之一,成本只有三分之一。
Tachyum 大膽宣稱 Prodigy 超級計算機芯片的性能是市場上英特爾最快的 Xeon 芯片的四倍,在高性能計算應(yīng)用中的原始性能是 Nvidia H100 的三倍。同時,能效提高了 10 倍。
Tachyum 表示,為了在單核架構(gòu)中創(chuàng)造如此令人印象深刻的性能,它從頭開始構(gòu)建了具有矩陣和矢量處理能力的 Prodigy,而不是后面才考慮它們。Prodigy 支持一系列數(shù)據(jù)類型,包括 FP64、FP32、TF32、BF16、Int8、FP8 和 TAI,所有這些都來自各個 CPU 內(nèi)核本身。
Prodigy 處理器在 2023 年問世時可能會改變游戲規(guī)則。AMD、英特爾和 Nvidia 的最新服務(wù)器硬件都依賴于單個硬件 —— 即使在單個 CPU 或 GPU 中 —— 來執(zhí)行這些不同的工作負載。這方面的一個例子是 Nvidia 的 RTX 系列 GPU,它需要專用的機器學(xué)習(xí) Tensor 內(nèi)核才能使 AI 工作,而專用的 RT 內(nèi)核則需要用于光線追蹤應(yīng)用程序。
另一方面,Prodigy 將能夠在單個內(nèi)核上運行光線追蹤和 AI 應(yīng)用程序,并且不需要將數(shù)據(jù)轉(zhuǎn)移到微處理器內(nèi)部的另一個芯片上。
在單個芯片內(nèi)運行所有這些不同的 HPC 工作負載可能會極大地改變服務(wù)器格局:公司將能夠?qū)⒏嘈酒虬椒?wù)器場中,同時降低功耗和冷卻。
Prodigy T16128 采用未知來源的 5nm 工藝技術(shù)運行,并在非常小的(就其提供的功率而言)64 mm x 84mm FCLGA 封裝內(nèi)運行。Tachyum 表示,在 HPC 工作負載方面,該芯片能夠執(zhí)行 12 AI PetaFLOPS 和 90 TeraFLOPS。Prodigy 芯片還可以運行適用于 x86、ARM、RISC-V 和 ISA 的二進制文件。從某種角度來看,單個 Nvidia A100 只能實現(xiàn) 5 AI PetaFLOPS。
每個內(nèi)核特別能夠執(zhí)行 2 個 1024 位向量單元、4096 位矩陣運算和每個時鐘 4 個亂序指令。還支持虛擬化和高級 RAS。該芯片還包括超過 128MB 的具有糾錯功能的 L2+L3 高速緩存。為了滿足其所有內(nèi)核的需求,該芯片配備了 16 個 DDR5 內(nèi)存控制器,額定速度高達 7200MT / s,每個插槽的最大容量為 8TB。
T16128 是 Tachyum Prodigy 系列中的旗艦型號,產(chǎn)品堆棧中的中端和入門級插槽分別有 64 核 T864 和 32 核 T832。芯片生產(chǎn)將于 2023 年開始,因此我們應(yīng)該會在明年某個時候看到這些芯片的實際基準測試性能。