了解某人心里的想法,就更能理解他的行為。對人工智能(AI)也同樣如此。最近,一項新的技術(shù)能夠在神經(jīng)網(wǎng)絡(luò)處理問題時「抓拍快照」,將能有助于我們了解神經(jīng)網(wǎng)絡(luò)究竟是如何工作的,并能為我們帶來更好、更值得信任的AI。
過去幾年,構(gòu)建于神經(jīng)網(wǎng)絡(luò)(多層相互連接的人工神經(jīng))之上的深度學(xué)習(xí)算法在AI的許多領(lǐng)域都取得了突破性的進展,包括自然語言處理、圖像識別、醫(yī)療診斷和下圍棋。
但有一個問題困擾著人們,那就是我們并不知道它們是如何做到這些的。以色列理工學(xué)院的Nir Ben Zrihem說,深度學(xué)習(xí)系統(tǒng)是一個黑盒子?!溉绻\轉(zhuǎn)良好,那很好。如果它不工作,你就慘了。
神經(jīng)網(wǎng)絡(luò)遠(yuǎn)遠(yuǎn)大于它的各部分之和。它們的組成單元非常簡單——就是人工神經(jīng)。Zrihem說:「你沒法指著神經(jīng)網(wǎng)絡(luò)中的一個區(qū)域,然后說,智能就存 在于此?!沟沁B接的復(fù)雜性意味著我們有可能追蹤深度學(xué)習(xí)算法到達(dá)某個給定結(jié)果的步驟。在這種情況下,機器表現(xiàn)得很像一個先知,而它的結(jié)果則不證而明。
為了解決這個問題,Zrihem和他的同事創(chuàng)造出了深度學(xué)習(xí)的實時圖像。他們說,這項技術(shù)就像計算機的fMRI(功能性核磁共振),可以捕捉到算法解決問題時的行為。這些圖像允許研究者追蹤神經(jīng)網(wǎng)絡(luò)進程中的不同階段,包括死胡同。
為了得到這些圖像,這個團隊交給一個神經(jīng)網(wǎng)絡(luò)一項任務(wù)——玩經(jīng)典的Atari 2600電子游戲:《打磚塊》(Breakout)、《海底救人》(Seaquest)和《吃豆人》(Pac-Man)。當(dāng)這個深度學(xué)習(xí)算法玩游戲時,他們收集了這個算法的12萬張「快照」。接著,他們采用一種技術(shù)繪制了這些數(shù)據(jù)的圖譜,這種技術(shù)允許他們對游戲中反復(fù)嘗試的場景進行比較。
結(jié)果真的很像真正的大腦掃描圖(如下圖,左邊是《海底救人》,右邊是《吃豆人》)。只不過在這個案例中,每個點都是一個「游戲狀態(tài)(game state)」,也就是游戲中每個時間點的一張快照。不同的顏色代表AI在那個時間點的表現(xiàn)如何。
比如說,在《打磚塊》中,玩家必須用一根橫條和一個小球在彩色磚塊組成的墻上撞出一個洞。每次算法嘗試在墻上鉆出一條隧道并把小球逼入墻頂區(qū)域時, 這個團隊就會在圖譜中發(fā)現(xiàn)一個明顯呈香蕉形狀的區(qū)域,這就是算法自己找出來的獲勝技巧。繪制過關(guān)技巧的圖譜,讓研究者能追蹤該算法如何成功地將技巧運用在 后續(xù)的游戲中。
在《海底救人》中,玩家必須要躲避、收集或毀壞某些物體,并救起水下的潛水者才能獲勝。這個游戲?qū)I來說更難掌握。在這些圖譜中,研究者發(fā)現(xiàn)了數(shù)不清的失敗策略,比如說在營救潛水者之前等待太長時間。Zrihem說,算法進行再次訓(xùn)練時,這些細(xì)節(jié)可能十分有用。
構(gòu)建一個完美的游戲策略是一件很好玩的事。對AI進行掃描則可以幫助我們磨煉算法,以設(shè)計出解決真實問題的算法,美國懷俄明州立大學(xué)的Jeff Clane如此說道。Clane對圖像識別算法的研究讓他創(chuàng)作出了一些可以迷惑神經(jīng)網(wǎng)絡(luò)的「錯覺」,能讓神經(jīng)網(wǎng)絡(luò)認(rèn)為圖片上的某處存在一些實際上并不存在 的東西。
比如說,一個安全算法可能存在某些缺陷,讓它在某些特定的情況下很容易被愚弄。還有一些算法,本是設(shè)計來確定銀行是否應(yīng)該向某人發(fā)放貸款,結(jié)果它可 能會對某些特定種族或性別的人產(chǎn)生偏見。Clane說:「如果你將這項技術(shù)部署到真實世界,你會想要理解它究竟是如何工作的,以及它在什么情況下可能會失 效。如果我們能更好地理解神經(jīng)網(wǎng)絡(luò),那我們就能理解它們的弱點,并增強它們的長處。