“2023知乎發(fā)現(xiàn)大會(huì)”上,知乎創(chuàng)始人、董事長(zhǎng)兼CEO周源和知乎合作人、CTO李大海共同宣布了知乎與面壁智能在AI大模型上的最新合作與應(yīng)用,正式發(fā)布“知海圖AI”中文大模型。
據(jù)了解,知乎通過(guò)聯(lián)合研發(fā)與戰(zhàn)略投資的方式與國(guó)內(nèi)頂尖大模型團(tuán)隊(duì)面壁智能達(dá)成深合作,共同開發(fā)中文大模型產(chǎn)品并推進(jìn)應(yīng)用落地。
目前,知乎和面壁智能合作自研的“知海圖AI”中文大模型,已經(jīng)運(yùn)用進(jìn)了知乎熱榜,知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測(cè),利用語(yǔ)言理解能力對(duì)知乎熱榜上的問(wèn)題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶。
據(jù)了解,面壁智能在2020年年底發(fā)布了首個(gè)中文大語(yǔ)言模型 CPM-1,之后又陸續(xù)發(fā)布了CPM-2、CPM-3和CPM-Ant等模型。其創(chuàng)始團(tuán)隊(duì)成員全部來(lái)自清華大學(xué)計(jì)算機(jī)自然語(yǔ)言處理與社會(huì)人文計(jì)算實(shí)驗(yàn)室(清華大學(xué)NLP實(shí)驗(yàn)室)。
值得一提的是,面壁智能與知乎有很深的淵源,面壁智能CTO曾國(guó)洋是知乎機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)秀答主,與知乎在2018年就有過(guò)學(xué)術(shù)上的合作。
李大海在大會(huì)上介紹, “知乎與面壁智能在交流中發(fā)現(xiàn)彼此的產(chǎn)品觀和價(jià)值觀都很匹配,我們對(duì)面壁進(jìn)行了投資,并且展開了深入的模型共建過(guò)程?!?/p>
“經(jīng)過(guò)測(cè)試,在知乎熱榜的應(yīng)用場(chǎng)景下,知乎與面壁合作自研的大模型與GPT-4相比達(dá)到了持平的效果?!?曾國(guó)洋在演講中指出。
對(duì)此, 李大海在會(huì)后的采訪中解釋稱,該評(píng)測(cè)是在熱榜問(wèn)題下,把所有知友的回答觀點(diǎn)抽取聚合,抽取了40個(gè)提問(wèn)。
“在知乎這個(gè)場(chǎng)景里面,答主的回答千奇百怪、非常開放,甚至?xí)霈F(xiàn)觀點(diǎn)跟提問(wèn)沒(méi)有關(guān)系的情況。這對(duì)整個(gè)大模型很有挑戰(zhàn)。我們做了很多的工作,在這個(gè)場(chǎng)景下抽了40個(gè)提問(wèn)去做評(píng)測(cè)。評(píng)測(cè)以后,發(fā)現(xiàn)跟GPT-4在這方面基本持平,我們稍微差一些,但還是蠻不錯(cuò)的。”
談及ChatGPT這類大模型技術(shù)和應(yīng)用,對(duì)整個(gè)內(nèi)容行業(yè)的影響時(shí),周源認(rèn)為,首先是生產(chǎn)力和效率的提升,其次是場(chǎng)景的賦能和優(yōu)化,第三是工具的升級(jí)?!跋袼阉骱屯扑]這樣的偏工具化的場(chǎng)景里面,可以做很多的升級(jí)工作。我們大概也會(huì)圍繞這樣的推進(jìn)順序,在社區(qū)里面去做更多實(shí)踐?!?/p>
在AI大模型的競(jìng)逐中,算力是關(guān)鍵因素。李大海表示,這方面也與國(guó)內(nèi)廠商洽談合作。
“我們發(fā)現(xiàn)其實(shí)有一些場(chǎng)景,很多國(guó)產(chǎn)廠商表現(xiàn)非常好,會(huì)跟他們合作。另外,英偉達(dá)H800、A800這些在國(guó)內(nèi)都可以用了,我們也在跟廠商進(jìn)行深入地溝通,所以并沒(méi)有大家想象這么大的問(wèn)題。”
浙江大學(xué)國(guó)際聯(lián)合商學(xué)院數(shù)字經(jīng)濟(jì)與金融創(chuàng)新研究中心聯(lián)席主任、研究員盤和林表示了對(duì)知乎大模型的期待。
“因?yàn)橹醯倪\(yùn)營(yíng)模式?jīng)Q定了其積累了大量高質(zhì)量的內(nèi)容,在當(dāng)前國(guó)內(nèi)互聯(lián)網(wǎng)高質(zhì)量?jī)?nèi)容匱乏的情況下,知乎的優(yōu)勢(shì)得天獨(dú)厚,的確具備構(gòu)建一個(gè)大模型的數(shù)據(jù)量。知乎也將因此受益?!?/p>
盤和林認(rèn)為,尤其是變現(xiàn)方面,知乎很可能通過(guò)AI大模型獲得一個(gè)強(qiáng)力的變現(xiàn)應(yīng)用端口?!爱?dāng)然,比較遺憾的是最近幾年知乎內(nèi)容質(zhì)量有所下滑,但如果有一個(gè)成功AI大模型,在生產(chǎn)力需求驅(qū)動(dòng)下,知乎很可能重回知識(shí)的內(nèi)核,而去除那些娛樂(lè)性質(zhì)的嚴(yán)選內(nèi)容?!?/p>
當(dāng)前各個(gè)大廠、創(chuàng)業(yè)企業(yè)紛紛扎堆大模型研發(fā),盤和林分析,這屬于正?,F(xiàn)象。
“當(dāng)然,各家資源稟賦各不相同,知乎的資源稟賦類似于百度,但數(shù)據(jù)質(zhì)量高于百度,而大模型的競(jìng)爭(zhēng)對(duì)這些企業(yè)自身生態(tài)發(fā)展也有好處,為了競(jìng)爭(zhēng),相信這些平臺(tái)將重新重視系統(tǒng)性、結(jié)構(gòu)工整的知識(shí)類內(nèi)容,這有利于我國(guó)科技和生產(chǎn)力的發(fā)展,所以要鼓勵(lì)大模型競(jìng)爭(zhēng),越多越好,最終由用戶來(lái)做選擇。”
互聯(lián)網(wǎng)分析師張京科指出,如今由ChatGPT所引領(lǐng)的大模型浪潮,是科技領(lǐng)域的一次跨時(shí)代進(jìn)步,但也存在巨大的用戶隱私安全風(fēng)險(xiǎn)。
“如今,互聯(lián)網(wǎng)公司正在嘗試用自己掌握的大數(shù)據(jù)投喂AI模型,很多時(shí)候廠商會(huì)以格式條款的協(xié)議獲得用戶各種隱私信息的授權(quán),面對(duì)這些APP簽訂的協(xié)議,用戶幾乎沒(méi)有選擇的余地。各大互聯(lián)網(wǎng)巨頭源源不斷地以用戶信息投喂獻(xiàn)祭,很多用戶也不介意類似的隱私安全風(fēng)險(xiǎn)。”
張京科指出,這意味著用戶所有的隱私、喜好、聊天、關(guān)系鏈,甚至密碼等等,未來(lái)有可能因?yàn)橐粋€(gè)小小的安全漏洞或者運(yùn)營(yíng)事故,而大白于天下。為此,應(yīng)制定更嚴(yán)格的用戶大數(shù)據(jù)使用標(biāo)準(zhǔn)等措施提前進(jìn)行預(yù)防。