在2017年的NVIDIA GPU Technology Conference (GTC)中,NVIDIA推出了針對(duì)全新人工智能(AI)和高性能計(jì)算(HPC)打造的GPU計(jì)算架構(gòu)Volta,并推出基于Volta的Tesla V100數(shù)據(jù)中心GPU。該公司稱新產(chǎn)品的計(jì)算效能達(dá)120 Teraflops,相當(dāng)于100個(gè)CPU的性能總和。
Volta是NVIDIA的第七代GPU架構(gòu),采用210億個(gè)晶體管構(gòu)建,并提供相當(dāng)于100個(gè)CPU的深度學(xué)習(xí)功能。它比NVIDIA目前的GPU架構(gòu)Pascal效能高出5倍,峰值的Teraflops效能則比兩年前推出的Maxwell架構(gòu)提高15倍。
該公司稱,這個(gè)效能表現(xiàn)超過(guò)摩爾定律的預(yù)測(cè)4倍。
人工智能的需求正在各行各業(yè)快速展開(kāi)。在汽車、醫(yī)療等行業(yè),數(shù)據(jù)科學(xué)家和研究人員們更多地依賴神經(jīng)網(wǎng)絡(luò)來(lái)推動(dòng)他們的技術(shù)進(jìn)展,例如讓自動(dòng)駕駛車輛的運(yùn)輸更安全、提供新的智能客戶體驗(yàn),以及加強(qiáng)抗癌研究等。
“人工智能帶來(lái)了智能的自動(dòng)化,將推動(dòng)自工業(yè)革命以來(lái)最大的一次社會(huì)進(jìn)展。”NVIDIA創(chuàng)辦人兼首席執(zhí)行官黃仁勛指出,深度學(xué)習(xí)讓計(jì)算器軟件擁有學(xué)習(xí)能力,帶來(lái)了突破性的人工智能,而Volta是NVIDIA數(shù)千名工程師花費(fèi)三年時(shí)間開(kāi)發(fā)的成果,目的是在各個(gè)行業(yè)都實(shí)現(xiàn)用人工智能改變生活的潛力。
劍指高性能數(shù)據(jù)中心
所有行業(yè)應(yīng)用的基礎(chǔ)--數(shù)據(jù)中心,也由于日漸復(fù)雜的網(wǎng)絡(luò),需要提供更強(qiáng)大的處理能力。他們需要有效的擴(kuò)展,以支持快速采用高度準(zhǔn)確的基于人工智能的服務(wù),如自然語(yǔ)言虛擬助手以及個(gè)性化搜索和推薦系統(tǒng)。
今年以來(lái)數(shù)據(jù)中心對(duì)芯片的需求持續(xù)增長(zhǎng),第一季度NVIDIA的數(shù)據(jù)中心營(yíng)收達(dá)到4.09億美元,勁增48.4%,優(yōu)于市場(chǎng)預(yù)期。盡管NVIDIA的數(shù)據(jù)中心營(yíng)收和對(duì)手英特爾(Intel)相比仍有4-5倍以上的差距,但該公司認(rèn)為其GPU架構(gòu)在高性能計(jì)算領(lǐng)域優(yōu)勢(shì)遠(yuǎn)超過(guò)傳統(tǒng)CPU。
NVIDIA表示,針對(duì)計(jì)算科學(xué)和數(shù)據(jù)科學(xué)應(yīng)用,Volta提供了新的平臺(tái)。通過(guò)將CUDA內(nèi)核和新的Volta Tensor Core配置在統(tǒng)一架構(gòu)中,采用單一Tesla V100 GPU的服務(wù)器可以替代搭載數(shù)百個(gè)CPU的傳統(tǒng)HPC服務(wù)器。
截至目前,Tesla GPU已經(jīng)應(yīng)用在全球主要網(wǎng)絡(luò)和云服務(wù)提供商,包括Alphabet的谷歌(Google)、臉書(shū)(Facebook)、IBM、微軟(Microsoft)和阿里巴巴等。
為了加強(qiáng)數(shù)據(jù)中心應(yīng)用,Tesla V100 GPU的搭載了640個(gè)Tensor內(nèi)核,并在GPU架構(gòu)中采用CUDA和Tensor配對(duì)的架構(gòu),在單一GPU中提供超級(jí)計(jì)算機(jī)的人工智能運(yùn)算效能。而為了實(shí)現(xiàn)芯片內(nèi)的高速互連,新的NVLink吞吐量也較上一代的NVLink提高二倍,以在GPU之間以及GPU到CPU之間提供高速通信能力。
另外,與三星(Samsung)合作開(kāi)發(fā)的900GB/s HBM2 DRAM實(shí)現(xiàn)了比上一代GPU多出50%的內(nèi)存帶寬,可支持Volta在高性能計(jì)算應(yīng)用中所需的計(jì)算吞吐量。