11月13日,恐怖組織ISIS在法國巴黎市中心制造多起槍擊爆炸事件。11月18日,我國公民樊京輝被ISIS作為人質(zhì)殘忍殺害。12月1日,美國加州圣貝納迪諾發(fā)生槍擊血案,殺手發(fā)動襲擊前曾宣誓效忠ISIS……在這樣嚴峻的形式下,全世界都敲響了反恐戰(zhàn)斗的警鐘。
那么,如何才能有效地打擊恐怖分子?此前,記者曾向大家介紹過,美國亞利桑那州立大學(xué)的Paulo Shakarian教授將人工智能技術(shù)用在了反恐和反犯罪的戰(zhàn)斗中(點擊此處訪問文章)。他畢業(yè)于西點軍校,在西點軍校擔(dān)任過計算機科學(xué)副教授,曾戰(zhàn)斗在伊拉克一線,擁有豐富的智能反恐經(jīng)驗。最近,記者對Shakarian教授進行了專訪,請他為中國讀者談一談自己的工作、人工智能在反恐中的應(yīng)用,以及他對和平的看法。
人物背景:Paulo Shakarian
Paulo Shakarian,美國亞利桑那州立大學(xué)計算機科學(xué)教授,馬里蘭大學(xué)計算機科學(xué)博士,畢業(yè)于西點軍校,曾在西點軍校電氣工程與計算機科學(xué)系擔(dān)任副教授,還擔(dān)任過美國軍方情報官員和DARPA研究員。2003年,他作為美軍第一裝甲師的軍方情報官員被派到了伊拉克,后又在駐扎德國的第501軍事情報旅擔(dān)任排長。在那里,他為軍隊收集、處理和分析了大量情報,還榮獲了銅星勛章。在伊拉克期間,Shakarian開始用他在西點軍校學(xué)到的計算機科學(xué)知識進行情報分析,并開始構(gòu)思用人工智能對恐怖襲擊進行建模。
采訪實錄
記者:說到反恐,很多人都會想到槍炮,但很少人會想到人工智能。請問您一開始是如何將二者聯(lián)系起來的呢?是和您的個人經(jīng)歷有關(guān)嗎?有沒有什么特殊的時刻讓您做出這個決定呢?
Shakarian教授:我在軍隊中服役時,曾在伊拉克待了2年,主要工作就是分析恐怖分子和叛亂團體的行為。2003到2004期間,我待在伊拉克,2006年到2007年期間,我又去到那里。說到計算機的使用,伊拉克戰(zhàn)爭與美國過去所涉入的所有戰(zhàn)爭都完全不同。我想,正是在這次沖突中,計算機系統(tǒng)首次成為了巡邏士兵的日常用品。這帶來的后果就是,前所未有的大量數(shù)據(jù)被收集進來了。2006年,我在一個小團隊中工作,這個團隊與一個伊拉克特別準軍事部隊的工作很緊密。跟隨這個部隊,我跑遍了伊拉克境內(nèi)的所有地方。在此過程中,我看到了許多不同的軍事部隊以不同的方式收集和分析數(shù)據(jù)。我之前曾獲得計算機科學(xué)的學(xué)士學(xué)位,所以我突然想到,許多分析都能用先進的算法來改進,還能提高效率。
從伊拉克回來之后,我被選為DARPA(美國國防部先進研究項目局)的研究員,在弗吉尼亞待了幾個月,了解了他們所使用的許多先進科技。
有了這些經(jīng)歷之后,我從2008年開始讀博士。當時我腦中已經(jīng)有一些關(guān)于人工智能如何改進反恐實戰(zhàn)的想法。研究院為我提供了一個機會,能在研究中探索我自己的想法。獲得博士學(xué)位后,我依然在繼續(xù)進行這些研究。不管是過去在西點軍校教書時,還是現(xiàn)在離開軍隊后來到亞利桑那州立大學(xué),我的研究都在持續(xù)進行。
記者:目前,人工智能在反恐中有什么應(yīng)用?與傳統(tǒng)方法相比,人工智能有什么優(yōu)勢?
Shakarian教授:人工智能在很多方面都能幫助反恐戰(zhàn)斗——因為這個領(lǐng)域中的很多問題對人類來說是巨大的挑戰(zhàn)。比如說:
1)找到恐怖團伙行為的時間格局(temporal patterns)能幫助我們理解到底是什么導(dǎo)致了某些特定的行為(正如我們在ISIS數(shù)據(jù)分析中所做的一樣)。
2)理解信息在社交媒體上是如何擴散的,有助于我們理解極端團體的哪些信息會對大眾產(chǎn)生共鳴,這非常重要(例如我們最近對預(yù)測社交媒體病毒傳播的研究:http://arxiv.org/abs/1508.03371)。(記者注解:關(guān)于這項研究,最近幾天你的朋友圈被「主要看氣質(zhì)」刷屏了嗎?或許你都不知道這條信息的源頭是什么,但它突然間就紅遍大江南北的社交媒體,就像病毒一樣,成指數(shù)級增長,這就叫「病毒傳播」??植婪肿右采朴诶貌《緜鞑ィ谏缃幻襟w上發(fā)布符合他們意識形態(tài)的信息。這種信息具有將普通人變成恐怖分子的潛力。所以,在早期識別出這樣的信息,對阻止恐怖信息的散布十分重要。那么,究竟什么樣的信息具備病毒傳播的潛質(zhì)呢?Shakarian教授和他的同事們用WISE(Web信息系統(tǒng)工程國際會議)2012年挑戰(zhàn)賽所提供的新浪微博數(shù)據(jù)庫,找到了一套可以預(yù)測信息「病毒性」的參數(shù)。他們研究的基礎(chǔ)是「結(jié)構(gòu)多樣性」(structural diversity),指的是某一個人所涉入的社交語境的數(shù)量,通??梢员硎緸橹苓厖^(qū)域內(nèi)獨立社區(qū)的數(shù)量。經(jīng)測試,這套方法的準確性達到0.69。)
3)理解恐怖分子的網(wǎng)絡(luò)及其結(jié)構(gòu),有助于制定更好的目標打擊計劃,最近這方面的研究也有很多。我之前在這個主題上也有一些研究(http://arxiv.org/abs/1211.0709)。(記者注解:關(guān)于這項研究:為了瓦解恐怖組織和反叛網(wǎng)絡(luò),國家安全機構(gòu)通常傾向于定點打擊「高價值目標」(HVT),也就是他們的首領(lǐng)。然而,有無數(shù)的例子證明,首領(lǐng)被擊斃后,反叛網(wǎng)絡(luò)很快就會再生成一位新的首領(lǐng)。例如,2006年6月8日,臭名昭著的基地組織首領(lǐng)阿布·穆薩布·扎卡維被擊斃后,一星期之后就出現(xiàn)了一位新首領(lǐng)阿布·艾尤卜·穆哈吉爾。如何瓦解這種首領(lǐng)的再生成機制呢?Shakarain引入了一個概念叫做「塑造」(shaping)行動,意思是說,在打擊首領(lǐng)之前,先打擊用算法識別出來的社交網(wǎng)絡(luò)節(jié)點,也就是小首領(lǐng),瓦解該組織產(chǎn)生新領(lǐng)導(dǎo)的能力,然后再擊斃首領(lǐng)。這樣,恐怖網(wǎng)絡(luò)就很難再生成一位新首領(lǐng),也就很難東山再起。下文有更多介紹。)
人工智能最重要的優(yōu)勢在于,我們能對恐怖分子、犯罪分子和極端分子建立更好的模型,采用的方式比人類在紙上的演算更加復(fù)雜和精巧,也更加有效。比如說,我曾經(jīng)和執(zhí)法機關(guān)的人一起工作,他們真的會花幾個星期的時間來畫一張包含幾十個犯罪分子的社交網(wǎng)絡(luò),從中來理解他們的組織結(jié)構(gòu)——而我們的軟件能處理幾百萬人的社交網(wǎng)絡(luò),并且只用花幾分鐘。
記者:能否向中國讀者簡單介紹一下您的研究?您在研究中都用到了哪些人工智能的技術(shù)?
Shakarian教授:現(xiàn)在,我是亞利桑那州立大學(xué)「網(wǎng)絡(luò)-社會智能系統(tǒng)實驗室(Cyber-Socio Intelligent Systems (CySIS) Laboratory)」的主任。我們用到了許多不同的人工智能技術(shù),包括數(shù)據(jù)挖掘、社交網(wǎng)絡(luò)分析、機器學(xué)習(xí)以及邏輯學(xué),旨在開發(fā)軟件系統(tǒng)以解決安全相關(guān)領(lǐng)域的問題。我們的研究已經(jīng)被用來支持軍隊、執(zhí)法機關(guān)和網(wǎng)絡(luò)安全的工作。我們的目標是理解那些能用先進的人工智能技術(shù)解決的安全問題。我們的理念是基于「使用啟發(fā)」(use inspired)來研究,也就是說,我們的研究受到實際應(yīng)用的影響很大。比如說,在與芝加哥警方合作的項目中,我們學(xué)到了很多東西,例如警察如何處理幫派暴力,以及他們最大的挑戰(zhàn)是什么。這將直接影響我們實驗室中的研究方向,讓我們更加專注于實際應(yīng)用所面臨的挑戰(zhàn)。
記者:在您的論文《挖掘因果關(guān)系:對ISIS的數(shù)據(jù)驅(qū)動研究》中,您分析了2200個事件,找到了其中一些看似毫無關(guān)聯(lián)的事情之間的聯(lián)系。在這個研究中,您用了什么人工智能的方法?下一步計劃是什么?
Shakarian教授:《挖掘因果關(guān)系:對ISIS的數(shù)據(jù)驅(qū)動研究》(Mining for Causal Relationships: A Data-Driven Study of the Islamic State)這篇論文最直觀的結(jié)果是,我們超越了相關(guān)性,檢驗了基于因果的時態(tài)關(guān)系。為什么我們需要超越相關(guān)性呢?因為,如果你擁有大量的信息(也就是「大數(shù)據(jù)」),你可能會遇到把巧合當成相關(guān)性的風(fēng)險。例如,有人發(fā)現(xiàn)美國邁阿密州的離婚率與人造黃油的人均消耗量相關(guān)(http://tylervigen.com/spurious-correlations)。然而,這兩件事之間顯然沒有任何關(guān)系——但是,如果我們事先并不知道黃油與離婚無關(guān),我們怎樣做出判斷呢?解決這個問題的其中一個方法(多虧了那個例子)就是找到其他可能的原因,并進行比較。在離婚-黃油的例子中,我們可以先假設(shè)黃油真的導(dǎo)致了離婚,然后把它與其他看起來也相關(guān)的變量(例如人均收入)進行比較。我們就是用這樣的方法對ISIS進行研究,這樣,我們發(fā)現(xiàn)的因果關(guān)系就更加可信。
(記者注解:這篇論文中,他們分析了戰(zhàn)爭研究所提供的2200個ISIS相關(guān)事件的數(shù)據(jù),構(gòu)建了一個模擬ISIS行為的算法。這2200個事件發(fā)生于2014年下半年,既包括了圍繞ISIS的軍事行動,也包括反對ISIS的勢力(包括伊拉克、敘利亞和美國領(lǐng)導(dǎo)的聯(lián)盟)。在其中,他們將邏輯程序和因果推理相結(jié)合,試圖挖掘出事件之間的因果關(guān)系。由此得出了ISIS的一些規(guī)律:
如果在某個星期,ISIS在伊拉克采取了步兵行動并伴有間接射擊,那么,下一個星期在敘利亞就會出現(xiàn)車載簡易爆炸裝置(VBIED)的行動。(p=1.0,εavg=0.92)
如果在某個星期,ISIS在伊拉克提克里特市采取了行動,并進行了大規(guī)模的處決,那么隨后,伊拉克和敘利亞就會同時出現(xiàn)大量簡易爆炸裝置(IED)。(p=1.0,εavg=0.97)
敘利亞政府空襲之后的一個星期內(nèi),ISIS往往會扣留大量人質(zhì)(εavg=0.91,p=0.67)。并且,在他們的數(shù)據(jù)庫中,類似的大規(guī)??哿艨偸前l(fā)生在敘利亞空襲之后。
如果聯(lián)軍空襲伊拉克摩蘇爾市的同時,ISIS正在對安巴爾省采取行動,那么在空襲后的一個星期內(nèi),ISIS在伊拉克的簡易爆炸裝置行動會大大增加(p=0.67,εavg=0.97)。然而,如果空襲的同時,ISIS還在對敘利亞采取行動,那么,當?shù)睾喴妆ㄑb置的使用也會增長(p=0.67,εavg=0.79)。
根據(jù)這些行為規(guī)律,他們得出了以下一些結(jié)論
ISIS可能會在除巴格達以外的其他區(qū)域采取大規(guī)模步兵行動之前,在巴格拉采取自殺式車載炸彈,來防止伊拉克軍隊/警察的增強部署。
ISIS傾向于在大規(guī)模步兵行動之前,采取間接射擊(IDF)作為前導(dǎo)——更符合傳統(tǒng)軍事力量,而不是大規(guī)模使用IDF來實現(xiàn)騷擾的目的(這在伊拉克自由行動期間的反叛團體中很常見)。
聯(lián)軍空襲與ISIS對簡易爆炸裝置的使用之間存在著關(guān)系,但卻沒有激發(fā)其他更大規(guī)模的武器(例如車載炸彈),這可能意味著ISIS在這種行動后,會依賴更加分散和反叛風(fēng)格的策略。
他們還發(fā)現(xiàn),有兩個目標對ISIS似乎有特別高的價值——巴拉德和拜伊吉。拜伊吉擁有一座主要的煉油廠,而巴拉德靠近一座重要的政府軍事基地。)
記者:機器學(xué)習(xí)需要大量的數(shù)據(jù)來訓(xùn)練。那么在反恐斗爭中,如何收集這些數(shù)據(jù)呢?
Shakarian教授:在許多機器學(xué)習(xí)的方法中,都需要大量的數(shù)據(jù)來構(gòu)建你想分析的實體(如恐怖團伙)的模型。然而,我們希望尋求多種方法,來最大限度地利用我們的數(shù)據(jù)。例如,我們使用地理社交網(wǎng)絡(luò)(geographic social network)分析來定位恐怖組織中那些社交關(guān)系緊密但地理位置較為分散的團伙(http://arxiv.org/abs/1305.3668)。有時候,在分析恐怖團伙時,理解你所收集的數(shù)據(jù)的各個方面是非常有用的——盡管有時信息的數(shù)量并不大。
記者:你的研究孵化出了一些具有變革潛力的項目,例如SCARE, ORCA, GANG和SNAKE。能否請您介紹一下這些項目,以及它們目前的運作情況?它們能預(yù)測人們的行為,從而預(yù)防犯罪嗎?
Shakarian教授:SCARE是一個設(shè)計來幫助定位反叛軍武器庫的軟件。它設(shè)計的初衷是讓士兵洞察出叛軍的武器可能藏在什么地方,從而阻止他們的路邊炸彈攻擊計劃。目前,我們正在使用這個軟件及相關(guān)的技術(shù)來幫助執(zhí)法機關(guān)定位失蹤人口——我們希望這個令人興奮的項目在接下來的幾個月里就會有結(jié)果。
ORCA和GANG是芝加哥警方使用的軟件包,用來分析街頭的犯罪幫派。二者的繼任者是VPRED(犯罪預(yù)測引擎,violence prediction engine ),使用街頭幫派的社會結(jié)構(gòu)數(shù)據(jù)來預(yù)測暴力犯罪分子。VPRED在今年夏天舉行的頂級數(shù)據(jù)挖掘會議KDD上公布(PPT:07-vpred_CySISTech_Aug20)。
SNAKE是一個執(zhí)法機關(guān)用來監(jiān)測社交媒體的軟件。它更加具有實驗性,但是,它的開發(fā)過程所帶來的經(jīng)驗教訓(xùn)促成了我們現(xiàn)在正在做的一項工作——用社交網(wǎng)絡(luò)/社交媒體來分析極端團體。最近,我們贏得了著名的美國國防部「密涅瓦」獎,獲得了資金來進行這項工作。具體而言,我們正在監(jiān)測社交媒體上的「病毒傳播」(goes viral)——目前我們的進展不錯。(記者注解:ISIS為何能從社交媒體上招募如此多的成員?Shakarain教授試圖用人工智能技術(shù)來破譯其中的秘密,理解為何ISIS的招募如何高效。例如,他們發(fā)現(xiàn),在利比亞和埃及的某些地區(qū),剛加入ISIS的年輕男性會在社交媒體上發(fā)布大量關(guān)于被西方國家剝削的內(nèi)容,這種行為很可能正是ISIS的一種信息戰(zhàn)術(shù)。他們正在研究病毒信息是如何從小圈子進入主流范圍的,基于此,就能夠預(yù)測哪些信息具有病毒信息的潛質(zhì)。)
「塑造恐怖網(wǎng)絡(luò)」(shaping terror network)是我在西點軍校和其他幾名同事研究的技術(shù)。這個想法的初衷是為了解決定位恐怖團伙頭目的問題。具體地說,這些組織本質(zhì)上富有彈性,容易在短期內(nèi)產(chǎn)生出新的魅力型領(lǐng)袖。為了解決這個問題,我和西點軍校的Devon Callahan、Jeff Nielsen和Tony Johnson研究出了一種理論,稱為「塑造」(shaping),旨在影響恐怖分子的社交結(jié)構(gòu),降低打擊頭目后的組織彈性。用這個方法,如果你先對恐怖網(wǎng)絡(luò)進行「塑造」(也就是先打擊首領(lǐng)之外的小頭目),就減少了潛在首領(lǐng)的數(shù)量。在「塑造」后再除去大首領(lǐng),就可以降低恐怖網(wǎng)絡(luò)的效率。這個研究引起了美國政府的興趣——不過我并不知道他們后來有沒有真的采取這種方法,因為那是高度機密的事。
記者:最近,隨著移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的飛速發(fā)展,我們能收集的數(shù)據(jù)也越來越多,導(dǎo)致了數(shù)據(jù)爆炸。大數(shù)據(jù)對反恐和打擊犯罪有何影響?如何使用這些數(shù)據(jù)?如何保護隱私?
Shakarian教授:這是個很有趣的問題,也是我經(jīng)常思考的問題。不管從反恐/反犯罪,還是從保護隱私的角度看,社交媒體、物聯(lián)網(wǎng)等技術(shù)帶來的挑戰(zhàn)都是巨大的。從反恐/反犯罪的方面看,這些新技術(shù)能帶來更多可收集的數(shù)據(jù),但是如果沒有處理大數(shù)據(jù)的方法來進行合宜的分析,這些數(shù)據(jù)都是無用的。此外,社交媒體等科技也為恐怖分子、極端分子等人提供了一種全新的犯罪方式——如何及時找出其中的重要信息,是一個很大的挑戰(zhàn)。在其中,保護隱私也是一個重要的方面,因為犯罪分子、恐怖分子、惡意黑客這樣的人會使用計算機平臺的開放性來盜竊人們的身份信息、籌集錢財、劫持電腦進行勒索或?qū)θ诉M行敲詐。我相信,許多人都沒有意識到,在使用這些新科技的同時,他們的個人信息已經(jīng)公開到了超乎想象的程度——也讓他們更易受到攻擊。保護人們的隱私、免受犯罪分子和極端分子的攻擊是非常重要的,這需要更好的科技教育。我認為,由于人們的大量個人信息都被暴露在外,因此未來可能會出現(xiàn)一些造成巨大經(jīng)濟損失的恐怖襲擊——所以,教育人們保護好自己的個人隱私,是非常重要的事情。
記者:您的研究能被用來預(yù)測ISIS未來的行動,保護那些潛在的受害者。那您是否有計劃更進一步,防止人們一開始就變成恐怖分子,防止他們加入ISIS呢?
Shakarian教授:是的,我們正在研究如何預(yù)防人們加入ISIS——這非常重要。這也是密涅瓦計劃的長期目標。目前,我也正在研究一種新理論,來「抑制」(inhibiting)信息在社交媒體上的擴散,并獲得了美國空軍的資助來完成這項研究。我的中心思想是理解哪些因素能「抑制」社交媒體上的病毒模因(viral meme )。所以,我們希望不久之后能夠找到方法來阻止極端宣傳的散播——包括招募新成員。(記者注解:Shakarain教授帶兒子在鳳凰城參觀消防博物館時,了解到消防員會用防火帶來阻止火勢蔓延,這給了他靈感——或許也可以為社交媒體上的恐怖信息建造一個防火帶,避免其變成病毒信息。在社交媒體上,最有可能成為社交媒體防火帶的,就是那些與各自的社交網(wǎng)絡(luò)聯(lián)系不緊密,或?qū)π畔⒉桓信d趣的人,他們會阻止信息的傳播。這種思想受到企業(yè)和政府的關(guān)注。對企業(yè)來說,他們希望找到那些阻止廣告信息蔓延的人,分析他們的特點并對其采取不同的市場策略。而政府則希望通過這種方法來遏制恐怖意識形態(tài)的蔓延。)
記者:你認為未來的恐怖主義和反恐戰(zhàn)斗會是怎樣的?
Shakarian教授:我認為,未來的恐怖主義最重要的領(lǐng)域是網(wǎng)絡(luò)空間。一些恐怖團伙已經(jīng)開始使用黑客技術(shù)了,但我認為這只是一個開始。這可能造成巨大的損失,所以這對未來的恐怖組織來說是一個具有吸引力的領(lǐng)域。所以,對反恐來說,網(wǎng)絡(luò)安全在未來將扮演一個重要的角色。
記者:伊隆·馬斯克和斯蒂芬·霍金都認為人工智能對人類非常危險,可能比核武器還要危險,有可能毀滅全人類。您怎么看待這件事呢?
Shakarian教授:人工智能和其他許多科技一樣,都有造福人類的潛力,也有可能被壞人利用,對人類造成極壞的影響——但是我并不認為它的破壞力比其他學(xué)科(例如物理學(xué)、生物學(xué)等等)更大。我認為AI之所以被一些人貼上「危險」的標簽,是因為近年來的一些進展超出了某些人的想象,尤其是領(lǐng)域外的人。即便如此,這些進展還是應(yīng)該促使我們思考科學(xué)和技術(shù)可能帶來的長期影響。——不過,我不認為人工智能有什么特別之處。
記者:愛因斯坦曾經(jīng)說:「和平不能依靠武力維系,唯有理解才能實現(xiàn)?!鼓J為和平最重要的因素是什么呢?
Shakarian教授:我認為愛因斯坦是對的。理解全世界各地的民族,了解他們的文化和需求,最終將帶來一個更加和平的世界。好消息是,在這種理解的過程中,科技將是一個關(guān)鍵的推動者——能讓我們更好地彼此理解。