“科技巨頭谷歌希望其核心產(chǎn)品能夠從人類語言中推斷出含義、回答多部分問題,并且看起來更像Google Assistant的聲音。人工智能的大型語言模型的搜索引擎可提出建議、檢索文檔、回答問題并完成廣泛的任務(wù),但依然存在偏見的風險。”
在谷歌一年一度舉辦的開發(fā)者大會I/O上,這家公司經(jīng)常會向世人展示令人驚嘆的人工智能。
2016年谷歌推出內(nèi)置Google Assistant的Google Home智能音箱;2018年為企業(yè)接聽電話和安排議程的Duplex首次亮相。
按照這一傳統(tǒng),上個月谷歌首席執(zhí)行官桑達爾·皮查伊推出LaMDA,一款“可就任何話題展開對話”的人工智能。
皮查伊演示了同紙飛機及天體冥王星交流是什么感覺。LaMDA會用三至四個句子回應(yīng)每一次問詢,就像兩個人進行的自然對話。
皮查伊說:“LaMDA將會慢慢地融入到谷歌其他產(chǎn)品之中,比如Assistant和Workspace及最關(guān)鍵的搜索,LaMDA的自然對話功能會使信息和計算從根本上更易于訪問和使用?!?/p>
LaMDA的推出得以一窺Google搜索的未來,未來的搜索已超越了鏈接列表,并可能改變數(shù)十億人網(wǎng)絡(luò)搜索的習慣。
以人工智能為主導,可推斷人類語言的含義,參與到對話當中,并像專家一樣回答由多方面問題。
谷歌還推出另一款名為多任務(wù)統(tǒng)一模型(Multitask Unified Model,MUM)的人工智能,可在搜索時將文本和圖像考慮在內(nèi)。
谷歌副總裁普拉巴卡·拉加表示用戶在不遠的將來可拍下一雙鞋的照片,然后向搜索引擎提問能否穿它攀登富士山。
MUM能夠生成75種語言的搜索結(jié)果,谷歌稱這樣可以讓它對世界理解的更為全面。
用戶提問“我爬過亞當斯山了,明年秋天想爬富士山,該怎么做?”后,這樣的搜索同我們今時今日的搜索表述大不相同,因為MUM會減少查找答案所需的搜索次數(shù)。
MUM既能概括文本也能生成文本;它會將亞當斯山與富士山進行比較,并且告知用戶為富士山之旅可能需要相關(guān)的健身訓練、登山裝備推薦及天氣預(yù)報方面的搜索結(jié)果。
上個月一篇名為《重新思考搜索:從半吊子到專家》的論文中,谷歌四位工程師將搜索比喻成同人類專家對話。比如目前搜索“紅酒的好處和壞處是什么?”,谷歌會回復一個要點列表。
該論文表示未來搜索引擎的回復可能看起來更像是一段話,比如紅酒可促進心血管健康,但會弄臟你的牙齒,還會完整顯示提及的信息來源與鏈接。
回復是文本形式,但也會變成口頭回復,就像現(xiàn)在Google Assistant的體驗一樣。
但過度依賴人工智能破解文本也存在風險,因為語言的微妙復雜仍讓計算機難以理解。
作為生成文本或回復問題等最先進人工智能的大型語言模型已顯示出放大偏見、生成不可預(yù)測或有害文本等傾向。
其中一個名為OpenAI的GPT-3模型已被用于在動畫角色中創(chuàng)建互動故事,但在一款在線游戲中也生成了涉及兒童性場景的文本。
麻省理工學院、英特爾及Facebook的研究人員發(fā)現(xiàn),大型語言模型表現(xiàn)出基于種族、性別、宗教、職業(yè)的刻板印象。
自然語言處理倫理學博士、語言學家拉切爾·塔特曼表示,這些大型語言模型生成的文本會越來越具有說服力,人們會相信正跟理解自己所表達意義的人工智能交談,但其實它們對世界并沒有常識性的理解。
但人工智能生成對殘疾人或穆斯林有害的文本或告訴人們?nèi)プ詺r就會產(chǎn)生問題。
塔特曼回憶起一位圖書管理員曾經(jīng)教過自己如何判斷谷歌的搜索結(jié)果是否有效,如果是將大型語言模型同搜索結(jié)合起來,用戶就得學會評估同AI專家的對話。
谷歌搜索是一家建立在PageRank之上的公司,PageRank曾是一種算法,由聯(lián)合創(chuàng)始人拉里·佩奇和謝爾蓋·布林在1990年代后期研究創(chuàng)建。
PageRank依賴于索引,是使用算法對網(wǎng)站進行排序和評估的過程。隨著時間的推移,谷歌又將龐大的事實庫知識圖譜融入到搜索結(jié)果里面。
最近谷歌將語言模型融入到搜索反饋。2019年谷歌曾將一種BERT模型植入到搜索中以回復對話式搜索查詢、建議搜索并對出現(xiàn)搜索結(jié)果下方的文本概括。
BERT還為微軟的Bing提供搜索結(jié)果。當時,谷歌副總裁潘杜·納亞克稱這是搜索領(lǐng)域五年來取得的最大進步,也是搜索歷史上最大的飛躍。
BERT的橫空出世使得各科技巨頭展開了一場競賽,競相創(chuàng)造出規(guī)模更大的語言模型,希望語言理解或回答問題等方面在GLUE等流行表現(xiàn)排行榜上勝出。
百度推出Ernie,Nvidia推出Megatron,微軟推出T-NLG,OpenAI推出GPT-3。工程師們會通過深度學習系統(tǒng)中人工智能神經(jīng)元之間的連接參數(shù)變量評估這些模型。
BERT包含數(shù)億個參數(shù),GPT-3參數(shù)則高達1750億。今年一月谷歌公布1萬億參數(shù)的語言模型。副總裁拉加稱參數(shù)上MUM比BERT強大1000倍。
谷歌研究人員稱索引是現(xiàn)代搜索的主力軍,但希望今后通過利用能理解更多問題,更為龐大的語言模型將索引取消。
比如知識圖譜能就事實性問題提供答案,但只在網(wǎng)絡(luò)的一小部分進行訓練。如果使用基于更廣泛的網(wǎng)絡(luò)構(gòu)建的語言模型,將使搜索引擎提出建議、檢索文檔、回答問題并完成廣泛的任務(wù),這種方法會帶來“思維的變革性轉(zhuǎn)變”。
但這樣的模型并不存在。事實上可能需要創(chuàng)造出通用人工智能,或在信息檢索和機器學習等領(lǐng)域取得進步才能實現(xiàn)。而且,這種新方法還能從多個角度提供權(quán)威答案,清晰地解釋來源,且不帶偏見。
谷歌一位發(fā)言人將LaMDA和MUM稱為自家公司下一代語言模型研究的一部分,并且表示MUM目前正在進行內(nèi)部試驗查詢數(shù)十億個主題。
Google Research并沒有為谷歌產(chǎn)品設(shè)定方向,谷歌產(chǎn)品的機器學習通常是作為補充而不是取代現(xiàn)有產(chǎn)品。
谷歌搜索算法的任何變化都將不可避免地影響其核心廣告業(yè)務(wù),該業(yè)務(wù)去年為谷歌創(chuàng)造 1470億美元收入。
搜索顧問邁克爾表示關(guān)于MUM登山靴的搜索回復演示表明,谷歌希望商業(yè)與消費者的連接方面發(fā)揮更大作用。
上個月的另一個顯著變化是谷歌引入Shopify集成,將170萬商家的商品帶到搜索結(jié)果中。外賣公司DoorDash和Postmates在2019年已進入搜索結(jié)果。
谷歌搜索結(jié)果已從由PageRank提供的鏈接列表演變?yōu)閷V告、知識面板、地圖、視頻和增強現(xiàn)實納入在內(nèi)。
這樣的轉(zhuǎn)變造成部分人所稱零點擊搜索(zero-click)的興起。零點擊搜索是指不再點擊網(wǎng)站來完成網(wǎng)絡(luò)搜索,這樣谷歌能在不需要用戶離開訪問的情況下獲得廣告收入。
數(shù)字數(shù)據(jù)公司Similarweb估計,去年近三分之二搜索當中用戶都沒有點擊進入到另一個頁面;在移動設(shè)備上點擊率(click-through rates)格外低。
邁克爾說:“在我看來,谷歌的野心要比向全世界賣廣告大多了,他們喜歡連接各方進行交易,因此我認為這一點得到極大增強?!?/p>
通過自然語言或圖像進行搜索可能會使用戶的注意力分散,不在關(guān)鍵字上,而且還會損害價值數(shù)十億美元的搜索引擎優(yōu)化業(yè)務(wù),目前各大企業(yè)仍競相依靠這一業(yè)務(wù)讓自己位于搜索結(jié)果頂部。
一些搜索引擎優(yōu)化公司一直在為自然語言的未來準備。
總部位于美國阿拉巴馬州伯明翰的初創(chuàng)公司Copysmith.ai 通過GPT-3為網(wǎng)站生成SEO元標簽。
首席執(zhí)行官赫恩·奧特蘭表示,谷歌最近的舉措不是一種威脅,而是整個人工智能領(lǐng)域又向前邁出一步。這表明我們正在朝著正確方向前進。
邁克爾表示:谷歌的公布可能需要數(shù)年才能實現(xiàn),谷歌想要的不僅僅是事實和鏈接的集合,而是希望自己更像是一位能夠回答復雜問題的專家。唯一的問題就是時間。
谷歌將大型語言模型作為商業(yè)戰(zhàn)略和研究重點的策略在公司內(nèi)部也引發(fā)了沖突。谷歌前AI倫理團隊的兩位前領(lǐng)導人在共同撰寫一篇此類模型擔憂的論文后就被迫宣布離職。
此外,大型語言模型會延續(xù)對人類的偏見和刻板印象,并可能造成氣候變化。
隨著語言模型越來越龐大,數(shù)據(jù)標記的貧乏和管理實踐的缺失會釀成更大問題。更重要的是,大語言模型對社會造成的危險最有可能施加在邊緣化社區(qū)身上。
今年1月,另一篇抨擊大型語言模型的人工智能研究論文的作者稱谷歌法律和政策團隊的干預(yù)“陰險至極”。
3月,谷歌DeepMind研究人員發(fā)現(xiàn),大型語言模型可通過傳播刻板印象、散播失業(yè)和虛假信息,在創(chuàng)作者沒有任何惡意的情況下造成社會危害。