自3月以來,國內(nèi)大模型進入“井噴”狀態(tài),從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機構(gòu)到科創(chuàng)企業(yè),大家對AI大模型都趨之若鶩,短時間內(nèi)紛紛推出自有的大模型產(chǎn)品。
▲a&s統(tǒng)計的部分大模型發(fā)布情況
根據(jù)科技部新一代人工智能發(fā)展研究中心5月底發(fā)布的《中國人工智能大模型地圖研究報告》顯示,我國10億參數(shù)規(guī)模以上的大模型已發(fā)布79個,幾乎進入“百模大戰(zhàn)”。
進入到四五月,大模型產(chǎn)品甚至以每日一款的速度扎堆誕生,一些AI、物聯(lián)網(wǎng)企業(yè)還有科技大佬個人在各自的領(lǐng)域開始了新一輪的“跑馬圈地”,從功能應(yīng)用、適用場景以及核心技術(shù)優(yōu)勢等方面宣告其大模型的特色和亮點。
為什么大模型會在這個時間節(jié)點集中爆發(fā)?
ChatGPT的發(fā)布像一根引線,一經(jīng)點燃,便燃起了大模型的熊熊之火,一時之間,玩家紛紛入場,各類大模型瘋狂涌現(xiàn)。
為什么大模型會在這個時間節(jié)點爆發(fā)?
海量參數(shù)規(guī)模條件催促大模型“涌現(xiàn)”
從純技術(shù)理論的角度看,中國科學(xué)院院士陳潤生表示,一個復(fù)雜系統(tǒng)由很多微小個體構(gòu)成,這些微小個體湊到一起,相互作用,當(dāng)數(shù)量足夠多時,在宏觀層面上展現(xiàn)出微觀個體無法解釋的特殊現(xiàn)象,即為“涌現(xiàn)”。大模型的運算表明,當(dāng)訓(xùn)練數(shù)據(jù)很大時(比如超過了1000億),就會出現(xiàn)“涌現(xiàn)”現(xiàn)象。
據(jù)目前市場已公布的大模型產(chǎn)品來看,10億參數(shù)規(guī)模以上的大模型產(chǎn)品已多達(dá)80個,其中像百度、騰訊、華為云等企業(yè)推出的大模型參數(shù)規(guī)模均已達(dá)千億已上。
當(dāng)參數(shù)規(guī)模達(dá)到一定量級的時候,大模型的涌現(xiàn)“現(xiàn)象”便具備了先決條件,這也是當(dāng)下大模型爆發(fā)的一大關(guān)鍵。
以技術(shù)驅(qū)動變革的產(chǎn)業(yè)有著它自己的發(fā)展路徑,中國電子信息產(chǎn)業(yè)發(fā)展研究院未來產(chǎn)業(yè)研究中心研究員、高級咨詢師鐘新龍同樣認(rèn)為,由于經(jīng)過這么多年的積累,特別是信息化數(shù)字化的長達(dá)10年至20年如此長的時間積累,所以我們相比歷史上任何一個時期,都有更多的數(shù)據(jù)可以用,這是訓(xùn)練大模型成為可能的必備要素。大模型即便放到歷史維度中提前的某一個時刻,可能因為數(shù)據(jù)不夠,訓(xùn)練的效果會不太好。
企業(yè)間的競爭角逐
大模型的爆發(fā),還跟企業(yè)間的競爭意識相關(guān)聯(lián)。
目前已推出大模型產(chǎn)品的企業(yè),無一例外是通用或垂直行業(yè)領(lǐng)域頭部玩家,這些玩家之間不排除很多企業(yè)存在“競爭”心理,人無我有,人有我優(yōu)的心態(tài)也驅(qū)動著大廠在大模型賽道你追我趕,推陳出新。
在人工智能領(lǐng)域,幾乎所有的研究團隊,包括頭部企業(yè)都在競爭開發(fā)最先進的大模型,而且不少頭部大模型都開始走向開源開放。這種競爭是一種良性的競爭,它有利于推動技術(shù)的發(fā)展,也有利于推動技術(shù)的共享。
產(chǎn)業(yè)認(rèn)知達(dá)成新的共識
底層技術(shù),包括數(shù)據(jù)、算力、算法的支撐為大模型奠定了必要的條件和基礎(chǔ),而國內(nèi)大模型在今年開始爆發(fā),還有一大原因在于大家對于AI大模型的應(yīng)用需求達(dá)到新的峰值。無論是用戶端還是技術(shù)供應(yīng)端,大家普遍看到了AI技術(shù)應(yīng)用的需求和困境,此前的AI工具普遍存在泛化能力不足,使用成本高企等問題,亟待通用性強、泛化能力強、能夠便捷使用的新的AI工具,AI大模型是數(shù)字經(jīng)濟驅(qū)動下產(chǎn)業(yè)認(rèn)知達(dá)成共識的產(chǎn)物。
目前市場上已發(fā)布的大模型普遍具備大規(guī)模和預(yù)訓(xùn)練的特點,一方面有良好的通用性、泛化性,能夠解決傳統(tǒng)AI應(yīng)用中門檻高、部署難的問題,另一方面可以作為技術(shù)底座,支撐智能化產(chǎn)品及應(yīng)用落地。
360創(chuàng)始人周鴻祎表示,互聯(lián)網(wǎng)公司都去做大模型的原因,是因為沒人能篤定某一家公司能做出來成功的大模型產(chǎn)品。但這個技術(shù)對中國很重要,它是工業(yè)級的,對各行各業(yè)都能帶來工業(yè)革命級的推動。
用大語言模型來變革業(yè)務(wù)層、為具體的業(yè)務(wù)落地場景賦能,這也已經(jīng)是諸多互聯(lián)網(wǎng)廠商的共同策略。并且在當(dāng)下這個存量市場中,在效率上的些許變化就已經(jīng)能兌現(xiàn)為競爭優(yōu)勢。
大模型成為應(yīng)對AI領(lǐng)域應(yīng)用碎片化的一種方式。
大模型也正在改變AI產(chǎn)業(yè)的規(guī)劃與格局。比方說,牽引AI產(chǎn)業(yè)快速收斂,構(gòu)建AI產(chǎn)業(yè)的底座;匯聚和沉淀行業(yè)生態(tài)及開發(fā)者生態(tài),形成產(chǎn)業(yè)生態(tài)黏性。