5月27日,“2023?黑馬AIGC峰會”在京舉辦。有趣的是,360集團董事長周鴻祎在這次會議上,首次以“數(shù)字分身”形式參加,引發(fā)極大關(guān)注。
以下為周鴻祎的數(shù)字分身現(xiàn)場分享內(nèi)容整理:
很多朋友很關(guān)心360的大模型進展,我來講講360發(fā)展大模型的優(yōu)勢與策略,做廣告的同時也給大家一個參考。
首先明確一個認知,大模型是超級人工智能到來的拐點,也是通用人工智能發(fā)展的基點。原來的人工智能是弱智能,帶來的影響有限,而大模型屬于通用人工智能,在很多維度上已經(jīng)超越了人類。這次GPT出現(xiàn),最大的意義是人類第一次把所有知識進行了重新編碼和存儲,現(xiàn)在GPT-4已經(jīng)是世界上最聰明的人,這是一個巨大的拐點。
為什么說GPT是通用人工智能?首先它用一套模型、算法、數(shù)據(jù),解決了所有自然語言理解的問題;其次,GPT從感知進化到了認知,能夠理解文字、語言、分析、規(guī)劃,這對傳統(tǒng)人工智能是一場顛覆性的革命。
未來我們在人工智能的基礎(chǔ)上構(gòu)建數(shù)字化的新場景,能夠做到事半功倍。
所以我認為,GPT是生產(chǎn)力工具,而不僅僅是公司間競爭的利器。在大模型推動下,智能化才是數(shù)字化的高峰。過去很多人執(zhí)迷于大數(shù)據(jù),但不知道怎么用,大數(shù)據(jù)很像工業(yè)時代的石油,大模型像發(fā)電廠,把數(shù)據(jù)變成數(shù)據(jù)鏈,輸送給百行千業(yè),可以輸送未來所有的軟件、APP和網(wǎng)站。甚至,所有的行業(yè)在通用人工智能大語言模型的加持之下,都值得重塑一遍。
我們總結(jié)了開發(fā)大模型的技術(shù)實踐,可以分為五個步驟:
第一步,構(gòu)建一個大模型;
第二步,無監(jiān)督學習,把知識灌進大模型;
第三步,監(jiān)督微調(diào),強化學習,做人工知識標注;
第四步,價值觀糾偏;
第五步,上下文學習,在用戶使用場景中不斷地迭代優(yōu)化大模型。
這五步中,數(shù)據(jù)、訓練方法和場景,是大模型能否做成功的關(guān)鍵。
那么,如何描述360的人工智能策略?我可以用八個字:兩翼齊飛,技術(shù)并發(fā)。
360并不是突然切入人工智能賽道的,實際上2015年我們就成立了人工智能研究院,2018年開始探索多模態(tài)的數(shù)字技術(shù)應用,2022年在知識圖譜的世界杯比賽里戰(zhàn)勝了圖靈獎團隊,獲得了冠軍。
為什么微軟、谷歌、百度等搜索引擎公司都在發(fā)展GPT?因為做搜索的公司天然有發(fā)展大語言模型的技術(shù)基因,作為國內(nèi)第二大搜索引擎廠商,360發(fā)展大模型可以說順理成章。
很多人問我,大模型到底有沒有門檻?事實上我認為大模型的底層架構(gòu)、技術(shù)原理都差不多,今天大模型的競爭主要集中于用什么數(shù)據(jù)來進行訓練,以及用什么樣的訓練方法來提升模型的能力。360這些年在搜索上的積淀,讓我們擁有大規(guī)模、多樣性、高質(zhì)量的訓練語料,具備很多公司不具備的數(shù)據(jù)獲取和清洗能力。
目前,ChatGPT有兩個最大的短板,恰好我們的搜索引擎都可以彌補。一是數(shù)據(jù)更新不及時,而搜索引擎恰恰能夠搜索到最新的數(shù)據(jù)和知識,幫助它及時更新,我們現(xiàn)在已經(jīng)把360搜索和大語言模型連在了一起,完全解決了這個問題。GPT的另一個缺點是幻覺,說白了就是胡說八道,這是GPT在很多專業(yè)應用場景上最致命的問題。這種情況下更需要搜索的知識校正,360有強大的搜索能力,它和大模型之間能夠形成相互增強,形成正向的雙向循環(huán),用來解決大模型知識滯后、知識模糊、數(shù)據(jù)校對的問題。反過來,大模型能夠提升搜索難以解決的低質(zhì)量回答問題。
與眾多互聯(lián)網(wǎng)公司相比,360還具有工程化優(yōu)勢,就是大流量、大用戶的工程化調(diào)度能力,這是已經(jīng)被證明過的。同時360還擁有強大的AI內(nèi)容安全隊伍,可以保證數(shù)據(jù)安全輸出。作為一家以安全聞名的廠商,360也有多年積累,我們打造的大模型安全風險評估體系,可以為全球大模型安全賦能。我相信,大模型能不能保證自身的安全會成為未來的核心競爭力之一。
在算力方面,360把算力分為兩部分:訓練算力和推理算力。
在訓練算力上,我們在6月份至少可以擁有600臺8卡服務器,將近5000張顯卡。這方面360的理念和其他公司不太一樣,很多公司都拿AI做數(shù)據(jù)推理,這是很大的浪費。360拿消費級的顯卡來做推理的機器,解決了很多問題,取得了一些成果。
目前在核心大模型上,360已經(jīng)完成上千億個參數(shù)的大模型布局,包括360GPT以及一個多模態(tài)大模型,還有與清華智譜AI合作研發(fā)的360PLM大模型,最近在多個權(quán)威第三方評測中,比如中文模型基準評測SuperCUE中,360大模型的總分也是國內(nèi)領(lǐng)跑的。
在場景布局方面,360的策略叫做“四路并發(fā)”。其中,面向消費者,我們用搜索和瀏覽器打造用戶的個人AI助理;面向中小微企業(yè),打造SaaS化垂直應用工具;面向企業(yè)/政府/城市,合作打造私有化部署GPT;最后面向行業(yè),360將攜手行業(yè)伙伴,與擁有行業(yè)數(shù)據(jù)的龍頭企業(yè)共同打造行業(yè)的垂直GPT。
今天,面向黑馬的伙伴,我想重點講講企業(yè)的場景。
企業(yè)在使用公有GPT的時候會面臨幾個問題:一是使用過程中數(shù)據(jù)可能會泄露;二是GPT行業(yè)知識深度不夠,對企業(yè)也不了解,通用模型可能不會用。
所以,我認為,未來企業(yè)可能需要基于公有GPT,通過公有云數(shù)據(jù)訓練、行業(yè)數(shù)據(jù)訓練、企業(yè)數(shù)據(jù)訓練、機密數(shù)據(jù)融合這四步,打造企業(yè)的專有GPT。專有GPT相當于企業(yè)的AI中臺,能夠提供四個方面的價值:一是能變成員工的知識助手;二是成為員工的辦公助手,提升辦公的效率;三是成為領(lǐng)導的決策助手;四是成為企業(yè)的智能客服。
這個AI中臺未來存在兩種可能:一是成為“副駕駛”,大模型賦能企業(yè)的內(nèi)部業(yè)務系統(tǒng);二是未來還有可能成為企業(yè)內(nèi)部的“主駕駛”,當大模型變成企業(yè)內(nèi)部所有信息系統(tǒng)的前端,會成為企業(yè)內(nèi)部的智能調(diào)度中樞,知識多引擎調(diào)度能力實際上就是engine模式,把企業(yè)內(nèi)部的信息系統(tǒng)都變成企業(yè)專有GPT的插件。
大模型在中國的發(fā)展和每一個企業(yè)的發(fā)展都息息相關(guān),特別是將成為中小企業(yè)最有力的武器,不管你在哪個行業(yè),都有機會通過大模型實現(xiàn)突破和反超。反過來說,不能搭上這班車的企業(yè)也將面臨淘汰。
但是,很多中小企業(yè)可能沒有這方面的技術(shù)基礎(chǔ),怎么選擇大模型、利用大模型,是很多企業(yè)家面臨的困惑。為了探索解決之道,我們今天正式宣布和創(chuàng)業(yè)黑馬開展戰(zhàn)略合作。
未來,360會和黑馬一起通過技術(shù)服務等形式,在AIGC這個領(lǐng)域?qū)Υ竽P偷陌l(fā)展和中小企業(yè)的應用做幾件事,包括:成立產(chǎn)學研一體化的大模型聯(lián)盟,聯(lián)合研發(fā)行業(yè)垂類模型核心業(yè)務,打造城市產(chǎn)業(yè)項目在AI領(lǐng)域的標桿等。
未來中國不會只有一個GPT,現(xiàn)在也只有幾十家科技公司發(fā)布了自己的大模型,都還沒有在用戶場景里,讓用戶廣泛使用、接受用戶的真實反饋,所以,大模型帶來的這場工業(yè)革命才剛剛拉開序幕。
我相信,未來無論是AIGC產(chǎn)業(yè)在中國的發(fā)展,還是360和黑馬的合作,都會帶來令人矚目的價值與成果,我們將共同見證、助力中國AIGC產(chǎn)業(yè)的繁榮發(fā)展!