a&s專業(yè)的自動化&安全生態(tài)服務平臺

公眾號

安全自動化

安防知識網(wǎng)

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應用搜索

首頁 > 資訊 > 正文

曠視張祥雨：“大”和“統(tǒng)一”成為視覺AI基礎(chǔ)研究新趨勢

2022-07-19 09:16 閱讀 1476 來源：安防知識網(wǎng) 評論區(qū)

基礎(chǔ)模型科研是AI創(chuàng)新突破的基石， “大”和“統(tǒng)一”已經(jīng)成為當今視覺AI系統(tǒng)研究的新趨勢。

　　7月15日，2022曠視技術(shù)開放日(MegTech 2022)在北京舉行。在本次活動上，曠視聯(lián)合創(chuàng)始人、CEO印奇進行了主題分享，闡述了曠視以AIoT為核心的企業(yè)戰(zhàn)略以及涵蓋從基礎(chǔ)研究、算法生產(chǎn)到軟硬一體化產(chǎn)品的AI落地全鏈路的“2+1”AIoT核心技術(shù)科研體系，即以“基礎(chǔ)算法科研”和“規(guī)模算法量產(chǎn)”為兩大核心的AI技術(shù)體系，和以“計算攝影學”為核心的“算法定義硬件”IoT技術(shù)體系。同時，曠視研究院基礎(chǔ)科研負責人張祥雨也在現(xiàn)場分享了曠視關(guān)于AI基礎(chǔ)研究的最新趨勢洞察和研究成果。

　“大”和“統(tǒng)一”成為視覺AI基礎(chǔ)研究新趨勢

　　自2012年AlexNet被提出以來，基于深度學習的神經(jīng)網(wǎng)絡成為AI視覺發(fā)展的核心原動力之一。神經(jīng)網(wǎng)絡根據(jù)用途、構(gòu)建方式的不同，大致可以分為CNN、Transformer、基于自動化神經(jīng)網(wǎng)絡架構(gòu)搜索的模型以及輕量化模型等，這些模型極大地推動了AI發(fā)展的歷史進程。

　　曠視研究院基礎(chǔ)科研負責人張祥雨認為：基礎(chǔ)模型科研是AI創(chuàng)新突破的基石， “大”和“統(tǒng)一”已經(jīng)成為當今視覺AI系統(tǒng)研究的新趨勢。

　　“大”并不意味好，要借助AI“大”模型持續(xù)拓展人工智能認知邊界

　　曠視認為，“大”是以創(chuàng)新的算法充分發(fā)揮大數(shù)據(jù)、大算力的威力，拓展AI認知的邊界。即利用大數(shù)據(jù)、大算力和大參數(shù)量，提高模型的表達能力，使得AI模型能夠適用于多種任務、多種數(shù)據(jù)和多種應用場景。

　　張祥雨認為，“大”是提高AI系統(tǒng)性能的重要捷徑之一。但是，但大并不意味好，片面地追求大參數(shù)量、大計算量和大數(shù)據(jù)量，并不一定能夠?qū)崿F(xiàn)更強大的模型，反而會產(chǎn)生更大的計算開銷，令整體收益非常有限。

　　基于這一行業(yè)洞察，曠視將其關(guān)于“大”的研究進行了更加精細的劃分。首先在大模型方面，曠視的研究不僅著眼于如何實現(xiàn)“大”，而是將會聚焦于如何充分發(fā)揮大模型背后的威力;其次在大算法方面，如果利用創(chuàng)新的算法將大模型的作用最大化，也將會是曠視未來重點關(guān)注的;最后在大應用方面，將重點解決大模型生成后如何進行合力的應用，提升AI模型性能。

　　用“統(tǒng)一”AI系統(tǒng)的設計思路，促進AI的通用化、規(guī)模化應用

　　AI視覺的研究領(lǐng)域眾多，包括CNNs、VL Models、 Transformers等基礎(chǔ)模型研發(fā)，物體檢測、分割等視覺基礎(chǔ)應用，優(yōu)化、自監(jiān)督、半監(jiān)督等AI算法演化等，每個研究路徑，都會衍生出一系列算法。

　　近幾年，不同研究路徑所衍生出的算法逐漸在底層走向統(tǒng)一，曠視借助特定的優(yōu)化算法，通過在訓練過程中增加先驗的方式，使得CNNs、VL Models、 Transformers都取得相似的性能，為曠視“統(tǒng)一”AI系統(tǒng)設計奠定了堅實的基礎(chǔ)。

　　此外，圍繞“統(tǒng)一”這一趨勢，曠視在“基礎(chǔ)模型架構(gòu)”、“算法”和“認知”，進行了全面布局。曠視基礎(chǔ)科研的“統(tǒng)一”，集中體現(xiàn)在統(tǒng)一各種基礎(chǔ)模型架構(gòu)，從紛繁的AI算法中提煉其本質(zhì)特性，使其能支持各種任務、數(shù)據(jù)和平臺，并最終構(gòu)建統(tǒng)一的、高性能的視覺AI系統(tǒng)。

　　基礎(chǔ)模型科研需要堅持長期主義

　　圍繞“大”和“統(tǒng)一”的研究趨勢，曠視基礎(chǔ)模型科研聚焦于通用圖像大模型、視頻理解大模型、計算攝影大模型和自動駕駛感知大模型四個方向，并取得了多項突出的科研成果。比如，在通用大模型方面，曠視提出了一種基于大Kernel的CNN和MLP設計范式。在自動駕駛感知大模型方面，曠視新提出的BEVDepth在權(quán)威的Benchmark NuSenses上，目前是Camera賽道上的第一名。此外，去年提出的一個非常簡單、通用，且高效的目標檢測框架YOLOX的GitHub Star已經(jīng)超過6000個。

　　張祥雨強調(diào)，基礎(chǔ)模型科研需要堅持長期主義，曠視將始終以原創(chuàng)、實用和本質(zhì)作為基礎(chǔ)科研的指導原則，致力于解決人工智能最本質(zhì)的難題。

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

您可能也喜歡這些文章

曠視張祥雨：“大”和“統(tǒng)一”成為視覺AI基礎(chǔ)研究新趨勢

曠視視覺AI

參與評論

回復：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

中文字幕日韩一区二区不卡,亚洲av永久无码精品天堂动漫,亚洲av无码国产精品麻豆天美,最新版天堂中文在线,中文字幕视频在线看

曠視張祥雨：“大”和“統(tǒng)一”成為視覺AI基礎(chǔ)研究新趨勢