提到警務大數(shù)據(jù)預測犯罪,人們立刻會聯(lián)想到電影《少數(shù)派報告》和CBS電視劇《數(shù)字追兇》,在今天的移動社交時代,社會化媒體的實時分析將成為警務大數(shù)據(jù)預測分析的熱點領域,但這將意味著實時分析海量大數(shù)據(jù)的技術挑戰(zhàn),也就是從“大數(shù)據(jù)警務”到“快數(shù)據(jù)警務”的挑戰(zhàn)。
也許不久后,紐約城警察局就能使用帶地理位置標簽的推文來預測犯罪。這聽起來就像是科幻電影少數(shù)派報 告里的場景(更像美國隊長2里的場景有木有,Hail Hydra),不過當我聯(lián)系這項技術背后的弗吉尼亞大學研究員Matthew Greber博士時,他解釋說這個系統(tǒng)并不是玄幻的,而是數(shù)學可行的。
Greber博士設計的這個系統(tǒng),混合了各種新舊技術。當下,許多警察局會根據(jù)犯罪頻率特定地監(jiān)控一些犯罪熱點。這個方法被稱作核密度估計(KDE),它 可以把歷史犯罪記錄和地理位置信息結(jié)合起來,用一個幾率函數(shù)計算出該地區(qū)未來會發(fā)生犯罪的幾率。不過,根據(jù)Gerber博士的研究論文“使用推特和核密度估計預測犯罪”,這個方法與推特的實時動態(tài)數(shù)據(jù)流相比,簡直弱爆了。
Greber博士的方法與KDE相似,但用網(wǎng)絡數(shù)據(jù)和編程語言替代了檔案。這套系統(tǒng)能繪制出一個推特環(huán)境,就像當下警察用KDE方法繪制出物理環(huán)境一樣。 大的差別在于,Greber博士看的是人們實時談論的熱點,和他們的后續(xù)動作,得到他們的匹配度。
Greber說,這個算法可以尋找區(qū)域內(nèi)暗示即將發(fā)生犯罪 的特定語句,“我們會觀察人們談論的話,出去啊,喝酒啊,逛吧啊,看比賽啊之類的。這些事件通常會與犯罪相關,這也就是模型要挑出的東西!
一旦收集到了數(shù)據(jù),推文上的GPS標簽允許Greber和團隊們在虛擬地圖上標出潛在犯罪的熱點。當然,并不是每個發(fā)推說待會逛酒吧的人都會實施犯罪。 Greber還比較了兩種KDE預測方法的準確度。不過問題是,這個方法真的有用么?對于Greber來說,答案是肯定有點用的!八軒椭恍┤耍矔 打擊一些人”。
根據(jù)研究結(jié)果,基于推特的KDE算法與傳統(tǒng)KDE方法相比,在預測跟蹤,刑事?lián)p害,和賭博問題的準確度上有所提升。但在縱火,綁架,勒索等問題上,準確度 卻相對較低。盡管尚不清楚為何使用推特反而更難預測這些犯罪,不過研究表示,這個問題可能與在推特上使用的語言有關,速記,非正式語言,會讓算法難以分 析。
這種高科技預防犯罪手段引發(fā)了很多關于濫用用戶隱私的爭論。讓警察使用這些數(shù)據(jù)來追蹤罪犯,讓事情變得極為敏感。關于這一點,盡管Greber知道一些社 會批評家反對國家使用私人數(shù)據(jù),但他卻是漠不關心。“人們勾選了用戶協(xié)議允許推文上帶有GPS標簽。這個一個可選的東西,如果你不勾選,你的數(shù)據(jù)就不會被 收集。推特是一個公開的服務,我想大家很清楚這一點!
Greber堅持說,使用這個系統(tǒng)對個人并沒有威脅,因為它只會記錄個人姓名,并不會對個人建模,也不會去識別罪犯。不過,問題并不在于警察會不會針對個人,而是團體和社區(qū)。這項技術的用處主要在于讓警察能高效地定位。
不過,Greber反駁說,“你可以說它會讓警察針對社區(qū),但事實上,警察已經(jīng)這么做了。警察們很清楚哪些社區(qū)比較壞,而且會針對性地分配更多警力!
Greber說,紐約警察局會先在皇后區(qū)和布朗克斯區(qū)試點使用(滿滿的惡意啊)。不過,大范圍采用還言之尚早,因為還沒有測試它是否真的能降低犯罪率。
關于我們
產(chǎn)品與平臺
企業(yè)信息咨詢