在空間數(shù)據(jù)挖掘領(lǐng)域中,熱點分析可以用于識別具有統(tǒng)計顯著性的高值(熱點)和低值(冷點)的空間聚類,得到高值或低值要素在空間發(fā)生聚類的位置。本文利用ARCGIS9.1中的熱點分析工具,分析了上海2009年的幾個侵犯財產(chǎn)類的違法案件數(shù)據(jù),找到了違法案件在不同時間的高發(fā)位置。通過空間數(shù)據(jù)挖掘,為情報、指揮和實戰(zhàn)部門決策提供參考和防范依據(jù)。
當(dāng)前在公安部門被廣泛采用的仍然是人工分析的手段,這種人工分析的方法往往面臨很大的挑戰(zhàn),例如分析的數(shù)據(jù)和信息通常分布在許多不同的數(shù)據(jù)源,信息量大且缺少關(guān)聯(lián)性;并且人工分析手段通常被看作是一種特殊的專業(yè)技能,很難在一個大的組織中進行經(jīng)驗的共享和傳遞,因而存在一定的局限性。
從國內(nèi)外與數(shù)據(jù)挖掘相關(guān)的研究領(lǐng)域中,我們發(fā)現(xiàn),采用可視化技術(shù)可將不同類型的數(shù)據(jù)和數(shù)據(jù)間隱含的關(guān)聯(lián)信息進行描述和展現(xiàn),并借助眾多空間數(shù)據(jù)挖掘的方法來發(fā)現(xiàn)和揭示數(shù)據(jù)中隱含的公共要素和關(guān)聯(lián),且已成為該領(lǐng)域研究所采用的手段和方法的發(fā)展趨勢。
城市違法案件在一定的地域環(huán)境下,并不是隨機分布的,而是與該地區(qū)的人口、環(huán)境、經(jīng)濟、政策、社會因素有著必然的聯(lián)系,并表現(xiàn)出一定的時間和空間形態(tài)。掌握違法案件的時空分布規(guī)律, 對有效打擊違法案件、提高民眾對社會安全信賴程度起著非常重要的作用。在眾多的空間數(shù)據(jù)挖掘方法中,熱點分析是理解事件間隱含關(guān)系的有效工具,通過熱點分析的數(shù)據(jù)挖掘可以有效地對事件做出回歸分析和前景預(yù)測,因此將違法案件治理、預(yù)防與熱點分析結(jié)合起來將更好地幫助研究人員得出科學(xué)的結(jié)論。
在空間數(shù)據(jù)挖掘領(lǐng)域里,學(xué)者們就熱點分析所做的研究工作大致可分為如下幾類:劃分技術(shù)、網(wǎng)格技術(shù)、密度技術(shù)、層次聚類技術(shù)以及空間自相關(guān)。這些方法各有特點,但空間自相關(guān)不僅能夠探測熱點,還能夠揭示事件間的聯(lián)系,所以本研究中采用自相關(guān)分析方法。
本文采用上海2009年盜竊、搶劫違法案件數(shù)據(jù)進行處理和熱點分析,并選取了常住人口密度、來滬人口密度等可能影響違法案件發(fā)生的18個指標(biāo)進行了主成分分析,探索隱含的空間關(guān)聯(lián)模式。有助于打破以往被動預(yù)防違法案件的局面,主動對重點區(qū)域、重點指標(biāo)加強管理,為城市預(yù)防違法案件措施在空間上的合理布局提供決策導(dǎo)向和參考。
研究區(qū)域與方法
研究區(qū)域與數(shù)據(jù)
研究范圍
研究區(qū)域上海,地處長江三角洲前緣,面積約為6340平方公里,1900多萬常住人口,是中國經(jīng)濟、金融、貿(mào)易和航運中心,共19個 區(qū)縣,包含“中心城核心區(qū)”包括黃浦、靜安、盧灣、虹口;“中心城邊緣區(qū)”包括楊浦、閘北、普陀、徐匯、長寧;“近郊區(qū)”包括青浦、松江、嘉定、閔行、寶山、浦東;“遠郊區(qū)”包括金山、奉賢、崇明。我們數(shù)據(jù)處理和統(tǒng)計的單元為派出所轄區(qū),共有441個。
數(shù)據(jù)來源與處理
空間數(shù)據(jù)包括行政區(qū)、派出所范圍。案件數(shù)據(jù)根據(jù)研究需要重點抽取了2009年搶劫、扒竊數(shù)據(jù),并按照派出所進行統(tǒng)計。人口、房屋數(shù)據(jù)包含戶籍人口、外來流動人口、境外人口、出租房、閑置房、自住房、集體宿舍、工地工棚,以及娛樂休閑等場所數(shù)據(jù),上述數(shù)據(jù)通過ETL工具,根據(jù)研究需要進行抽取,并進行了預(yù)處理。
研究方法
熱點分析Hotspot analysis
本次研究采用了ARCGIS9.1的熱點分析工具,熱點分析工具為數(shù)據(jù)集中的每一個要素計算 Getis-Ord Gi* ,得到高值或低值要素在空間發(fā)生聚類的位置。
Getis-Ord局部統(tǒng)計可表示為:
其中xj是要素j的屬性值,wi,j是要素i和j之間的空間權(quán)重,n為要素總數(shù),且:
主成分分析
主成分分析 ( Principal Component Analysis , PCA )是一種掌握事物主要矛盾的統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜的問題。
本次研究中,我們把盜竊、搶劫案件1到12月份熱點區(qū)域常住人口密度、來滬人口密度、境外人口密度、出租房數(shù)、閑置房數(shù)、自住房數(shù)、集體宿舍數(shù)、工地工棚數(shù)、旅店數(shù)、娛樂休閑場所數(shù)、歌舞廳數(shù)、網(wǎng)吧數(shù)、桑拿洗浴場所數(shù)、游藝游戲機房數(shù)、臺球廳數(shù)、酒吧數(shù)、咖啡吧數(shù)、茶室數(shù)量等18個指標(biāo),利用SPSS進行了主成分分析。
結(jié)果與討論
違法案件熱點的時空分布
計算結(jié)果得出了盜竊、搶劫案件每個派出所的Z、P值,當(dāng)P值<0.05時,形成的Z值有兩個區(qū)間,即Z>2.58,Z<-2.58,說明兩類案件都具有明顯的空間聚集,即具有熱點和冷點。圖1,圖2分別是上海市盜竊案件和搶劫案件的熱點、冷點時空分布圖,圖中深紅色表示案件的熱點區(qū)域,深藍色表示是案件的冷點區(qū)域。
圖1顯示盜竊案件違法案件熱點主要以“中心城核心區(qū)”為中心,隨季節(jié)變化而動態(tài)變化,前三季度主要向東西方向延伸,而第四季度向南北方向延伸,而遠郊區(qū)基本是違法案件冷點。圖2顯示,搶劫案件違法案件熱點主要集中在中心城邊緣區(qū)和近郊區(qū),而中心城核心區(qū)在大多數(shù)季節(jié)是違法案件冷點。
違法案件熱點相關(guān)因素的主成分分析
分析結(jié)果顯示同類案件不同時間的主成分分析結(jié)果基本一致。而盜竊案件和搶劫案件的分析結(jié)果還是有較大的差別。
表1
表2
表1,表2是2009年9月上海盜竊案件的主成分分析結(jié)果,表2剔除了累計貢獻率大于85%以后的成分。
表3
表4
表3、表4是2009年9月上海搶劫案件的主成分分析結(jié)果,表4中剔除了累計貢獻率大于85%以后的成分。
根據(jù)分析結(jié)果和實際調(diào)查,影響盜竊案件的主要因素是娛樂休閑場所、歌舞廳、游藝游戲機房、桑拿洗浴場所,而影響搶劫案件的主要因素是來滬流動人員密度和出租房屋數(shù)量。
結(jié)論
我們通過對上海2009年1月~12月的盜竊、搶劫數(shù)據(jù)進行空間數(shù)據(jù)挖掘,發(fā)現(xiàn)了上海盜竊、搶劫違法案件的整體態(tài)勢和空間上的動態(tài)變化趨勢,并通過主成分分析,解析出了影響盜竊、搶劫違法案件熱點的主要影響因素。
所以,我們建議在市中心區(qū)域加強娛樂休閑場所、歌舞廳、游藝游戲機房、桑拿洗浴場所等的管理,而在近郊地區(qū)加強來滬人員和出租房屋的管理,并加強巡邏。