4月17日,由全球人工智能頂級(jí)組織,神經(jīng)信息處理系統(tǒng)大會(huì)(NeurIPS)舉辦的自動(dòng)深度學(xué)習(xí) 總決賽公布最終成績(jī),浪潮賽隊(duì)以出色成績(jī)位列全球第三。
神經(jīng)信息處理系統(tǒng)大會(huì)舉辦的自動(dòng)深度學(xué)習(xí)系列賽是全球人工智能領(lǐng)域的頂級(jí)賽事,以難度大、賽題新、賽程長(zhǎng)著稱,每年的大賽就是全球頂級(jí)科研機(jī)構(gòu)在人工智能前沿領(lǐng)域的“華山論劍”。大賽歷時(shí)4個(gè)月,吸引了包括Google、微軟、卡內(nèi)基梅隆大學(xué)、清華大學(xué)等全球著名科研機(jī)構(gòu)和頂級(jí)人工智能科技公司參加。
史上最難,比拼人工智能“十項(xiàng)全能”
自動(dòng)深度學(xué)習(xí),相當(dāng)于能自己學(xué)習(xí)產(chǎn)生人工智能的超級(jí)人工智能,它能從各種不同類別數(shù)據(jù)中通過自動(dòng)學(xué)習(xí)生產(chǎn)強(qiáng)大的人工智能。本次自動(dòng)深度學(xué)習(xí) 總決賽堪稱史上最難的比賽,比拼的是各支參賽隊(duì)伍的“十項(xiàng)全能”。大賽難點(diǎn)在于每一個(gè)參賽隊(duì)伍都需要設(shè)計(jì)一套采用深度學(xué)習(xí)技術(shù)的人工智能系統(tǒng),來處理包括圖像、視頻、語音、文本和表格等五大任務(wù)共十種不同類別的數(shù)據(jù)集,每種任務(wù)的識(shí)別規(guī)則差異巨大,這就好比要求參賽隊(duì)伍訓(xùn)練出一個(gè)能看、能聽、能說的全能型人工智能模型,對(duì)于系統(tǒng)的數(shù)據(jù)處理能力、模型創(chuàng)建能力、以及模型的精度優(yōu)化都提出了巨大的挑戰(zhàn)。
在常規(guī)情況下,完成一種數(shù)據(jù)集任務(wù)的深度學(xué)習(xí)建模的開發(fā)調(diào)試,大約需要花費(fèi)一位專業(yè)人工智能算法工程師一周左右的工作量,如果再對(duì)這一任務(wù)開發(fā)數(shù)十種不同算法模型訓(xùn)練,耗時(shí)甚至長(zhǎng)達(dá)3-6個(gè)月。而本次大賽要求參賽隊(duì)伍使用一套深度學(xué)習(xí)系統(tǒng)來自動(dòng)處理識(shí)別10個(gè)不同領(lǐng)域的數(shù)據(jù)集,并且整個(gè)數(shù)據(jù)處理、建模、參數(shù)優(yōu)化的過程,全部由算法自動(dòng)完成,在20分鐘內(nèi)完成算法精度接近人工智能專家7天人工調(diào)試的精度。這無異于用百米沖刺的速度完成“鐵人三項(xiàng)”。
全自動(dòng)深度學(xué)習(xí)模型生產(chǎn)方式,效率提升萬倍
浪潮針對(duì)本次挑戰(zhàn)賽開發(fā)了自動(dòng)深度學(xué)習(xí)解決方案,將自動(dòng)數(shù)據(jù)處理,自動(dòng)模型構(gòu)建、自動(dòng)參數(shù)優(yōu)化等核心組件進(jìn)行全面優(yōu)化。實(shí)現(xiàn)了通過同一系統(tǒng)針對(duì)不同任務(wù)場(chǎng)景的全自動(dòng)化模型構(gòu)建;同時(shí),模型優(yōu)化的過程,由系統(tǒng)自動(dòng)化調(diào)試完成,大幅度提升了模型的識(shí)別精度和算法優(yōu)化效率。該方案的處理精度相比基準(zhǔn)值平均提升20%,數(shù)據(jù)讀取效率平均提升22%,半小時(shí)內(nèi)便可生成上千種算法模型,相比專家手動(dòng)創(chuàng)建模型,效率提升超過一萬倍。
此前,浪潮已經(jīng)在自動(dòng)機(jī)器學(xué)習(xí)、弱監(jiān)督學(xué)習(xí)等全球頂級(jí)人工智能賽事中進(jìn)入全球前三。取得這一系列競(jìng)賽佳績(jī)的,居然是剛剛走出校門不久的小哥哥小姐姐,擔(dān)任教練的博士還是個(gè)超級(jí)大帥哥。在本次決賽的關(guān)鍵時(shí)刻,因?yàn)橐咔?,其中一位小哥哥在張家口的鄉(xiāng)下被封路出不了村,竟然克服了不利局面取得佳績(jī),令人刮目相看。
目前,浪潮在競(jìng)賽中所使用的核心技術(shù),已經(jīng)應(yīng)用到浪潮的自動(dòng)機(jī)器學(xué)習(xí)人工智能算法平臺(tái)產(chǎn)品AutoML Suite中。在剛剛舉行的IPF2020浪潮云數(shù)據(jù)中心合作伙伴大會(huì)上,浪潮提出智算中心是人工智能的新基建,浪潮將為智算中心算力的生產(chǎn)、聚合、調(diào)度和釋放四大作業(yè)環(huán)節(jié)持續(xù)創(chuàng)新提供領(lǐng)先產(chǎn)品。而這種領(lǐng)先的產(chǎn)品技術(shù)能力,也正在通過其推出的“元腦”生態(tài)成為中國(guó)產(chǎn)業(yè)AI化進(jìn)程的核心驅(qū)動(dòng)力。