社交媒體為我們了解民眾的思想脈搏提供了重要的機(jī)遇:人們對于事件的反應(yīng)、對于重要問題的意見、政治情緒、呼吁舉行抗議活動以及其他一些事情。社交媒體還為防務(wù)、情報以及國土安全分析人員就潛在的危機(jī)提供了早期預(yù)警,如下一次“阿拉伯之春”運(yùn)動、軍事沖突或自然災(zāi)害。
如果最近發(fā)生了一次事件,居住在特定區(qū)域的人們因此對美國部隊心存不滿,則他們的憤怒或不滿情緒可能會隨時間的推移激化或平復(fù)。了解這種情緒起落的變化會有助于部隊提高自身的安全認(rèn)識。
“我們當(dāng)中的大多數(shù)人通過觀看電視了解事件,可能認(rèn)為情況還不至于那么糟糕,不過社交媒體可能會展現(xiàn)一些非常有影響力的個人的負(fù)面看法,他們會影響其他人的想法,”美國SAS公司聯(lián)邦國家安全小組主任麗貝卡?加西亞說,“如果我們不了解這種思想活動的軌跡,就有可能危及美國人員的安全。”
但這其中包含的龐大數(shù)據(jù)量使人們難于處理和分析。“此外,數(shù)據(jù)中噪聲的數(shù)量——手頭上與問題無關(guān)的信息——可能是驚人的,”Aptima公司分析、建模與仿真分部副總監(jiān)羅伯特?麥科馬克博士說。
從海量的噪音中清理出有價值的重要模因(meme,在諸如語言、觀念、信仰、行為方式等的傳遞過程中與基因在生物進(jìn)化過程中所起的作用相類似的因素。譯者注)是一項艱巨的任務(wù)。由用戶生成的鋪天蓋地、可公開訪問的內(nèi)容,如源于Twitter、博客和許多在線交流的信息,需要一種自動化的解決方案。
引入先進(jìn)的分析技術(shù)
這些技術(shù)會有助于人們從海量信息中找到重要主題和思想傾向,并且可以幫助一些人了解這些主題和傾向會對民眾造成何種影響。
社交媒體數(shù)據(jù)分析的全球性應(yīng)用有一些明顯案例,如去年在埃及和利比亞發(fā)生的眾所周知的事件,以及在日本和海地發(fā)生的自然災(zāi)害。全球第一條有關(guān)奧薩瑪?本?拉登在巴基斯坦的住所被攻破的消息就是由其鄰居通過微博公布的。社交媒體網(wǎng)絡(luò)對計劃周密的抗議、示威和行動提供了最早的現(xiàn)場報告。
“該技術(shù)有潛力利用互聯(lián)網(wǎng)上公開提供的海量信息,使得它對于社交媒體應(yīng)用特別有益,”諾思羅普?格魯曼信息系統(tǒng)公司地理空間業(yè)務(wù)開發(fā)總監(jiān)肖恩?萊烏評論道,“能夠就某一特定主題提煉具體信息,而不必費力埋頭于數(shù)PB(petabytes,1petabytes=1024TB,譯者注)的數(shù)據(jù),這顯著節(jié)約了大量時間,使最終用戶可以把他們的時間集中于具體的任務(wù)上,而不是集中于數(shù)據(jù)挖掘上。”
這樣一種分析技術(shù)必須能夠有效管理各種形式的社交媒體數(shù)據(jù),無論是結(jié)構(gòu)化的、非結(jié)構(gòu)化的/半結(jié)構(gòu)化的,包括視頻和音頻內(nèi)容。
“它同樣適用于軍事和情報應(yīng)用——以各種方式,從軍隊征兵工作人員開始,他們會找到有關(guān)征兵重要問題的公開數(shù)據(jù);一直到前線士兵想要了解在特定城鎮(zhèn)或地區(qū),民眾對于美軍存在現(xiàn)在有什么樣的情緒,”MicroTech公司總裁兼首席執(zhí)行官托尼?希門尼斯說,“在實際應(yīng)用之前,需要對社交媒體數(shù)據(jù)進(jìn)行分析,這通常超出了個人甚至是一個團(tuán)隊的能力。”
解決這個問題需要篩選大量數(shù)據(jù)以得到可操作的信息。
除了用于作戰(zhàn)的公開或外部交流的信息,內(nèi)部行動也能從社交媒體分析中獲益。皮尤研究中心開展的“互聯(lián)網(wǎng)與美國人生活項目”目前顯示:有65%的成年互聯(lián)網(wǎng)用戶正在使用社交網(wǎng)站。
“軍事行動是一項非常龐大的活動,當(dāng)然可以納入社交媒體與軍人保持接觸并使之參與行動,現(xiàn)在這種現(xiàn)象已經(jīng)變得非常普遍,”希門尼斯評論道,“以正確的心態(tài)分析軍隊人員的關(guān)切、傾向和問題,可能會產(chǎn)生更高的效率并使任務(wù)勝利完成。”
因此,社交媒體分析還為提高效率和支持作戰(zhàn)提供了又一種機(jī)遇,可以從豐富的公開數(shù)據(jù)中發(fā)現(xiàn)信息。
搜索算法
目前有許多公司針對社交媒體提供了先進(jìn)的分析技術(shù)。
例如,諾思魯普?格魯曼公司提供的一套工具利用算法通過對公開的信息進(jìn)行搜索,把數(shù)據(jù)的范圍縮小到預(yù)定的主題、類別和其他標(biāo)準(zhǔn)上。“然后對這些信息進(jìn)行排序,為終端用戶提供相關(guān)、有針對性可管理的數(shù)據(jù),”萊烏說。
諾斯魯普?格魯曼公司的工具旨在提醒官員注意可能的危機(jī)、沖突和社會傾向。
Aptima公司正在研究一項技術(shù),稱為信息發(fā)展流行模型(EpidemiologicalModeling of the Evolution of Messages,E-MEME),它把自然語言處理(natural language processing,NLP)與流行建模核心概念結(jié)合在一起。
信息發(fā)展流行模型采用自然語言處理技術(shù),篩選大量的互聯(lián)網(wǎng)數(shù)據(jù)資源和文件,從博客、新聞?wù)军c和實時社交平臺(如Twitter)中提取重要的認(rèn)知和傳播主題。這些技術(shù)用于描述并量化所討論的主題,如“抗議”和“選舉”等。
數(shù)學(xué)流行模型描繪了這些思想是如何在各個地區(qū)的民眾中隨時間的推移傳播和蔓延的。“流行學(xué)為我們提供了理解這一問題的一個出發(fā)點,以及正規(guī)化分析數(shù)據(jù)豐富的模型與技巧,”麥科馬克說。
麥科馬克解釋說,在一定層次上,信息發(fā)展流行模型的目的是根據(jù)現(xiàn)在社交媒體、博客和新聞上正在發(fā)生的事件,就有價值的當(dāng)前形勢,利用更好的信息提供情報分析。“例如,如果民眾對于抗議這一話題感興趣,信息發(fā)展流行模型將通過從幾個維度仔細(xì)劃分,提供媒體中有關(guān)這一主題的相關(guān)信息,如位置、團(tuán)隊或媒體類型,”他說。
此外,信息發(fā)展流行模型還將提供這一主題以往的發(fā)展趨勢,例如,使分析人員能夠清楚在特定的某個地點,人們談?wù)摗翱棺h”這一話題的興趣正在逐漸濃厚。“除此之外,基于模型的流行學(xué)還能使我們根據(jù)歷史數(shù)據(jù)和其他因素評估不同人群對于各種認(rèn)知的易感程度,”他說。
同時,情報分析人員還能開展“假設(shè)情況”分析,如評估一種認(rèn)識傳播的可能性,或特定地區(qū)的人群接受一種思想的可能性。
MicroTech公司提供解決方案以建立有效的社交媒體實踐,該公司發(fā)現(xiàn)“假設(shè)情況分析”有助于以幾種不同的規(guī)模和配置提供可擴(kuò)展的社交媒體解決方案,使用不同的硬件/軟件應(yīng)用程序,解決政府機(jī)構(gòu)廣泛的需要與需求。
“Social Recon Mobile是MicroTech公司研發(fā)的一種解決方案,它提供了必要的社交媒體功能,把軟件和硬件都包含在一種便攜式設(shè)備內(nèi),易于迅速部署,并具備幾乎是實時的社交媒體挖掘功能,”希門尼斯說。
Social Recon MicroPodd包括一套附加移動MicroPodd組件,能提供更大的存儲容量和更多功能。這種選項為現(xiàn)存的基礎(chǔ)設(shè)施提供了一種插件解決方案。
“分析人員可以從他們當(dāng)前的位置和工作站很方便地監(jiān)控并跟蹤用戶認(rèn)為重要的事情,”他說。
Social Recon MicroCenter是一項永久解決方案,根據(jù)現(xiàn)地情況定制,具備額外的社交挖掘功能,可以對特定社交媒體的整個社區(qū)進(jìn)行深入挖掘。
“隨著數(shù)據(jù)中心不斷虛擬化、一體化并更具效率,這種選擇為那些利用自身設(shè)施創(chuàng)建社交媒體功能的人們提供了一種決定性的競爭優(yōu)勢,”希門尼斯說。
托管解決方案
最后,社交媒體服務(wù)(Social Media as a Service,SMaaS)提供了一種與MicroTech公司其他解決方案不同的托管解決方案。社交媒體服務(wù)可以根據(jù)機(jī)構(gòu)和功能的需要量身定制,它針對所有特定的主題和關(guān)心的問題深入搜尋和探索,實施概念分析、目標(biāo)分析和/或系統(tǒng)報警。
“如果你正朝著一種信息技術(shù)管理策略努力,希望得到最大程度的靈活性;或者不能在新設(shè)備上進(jìn)行投資時,則它尤其適用,”希門尼斯說,“我們提供分析服務(wù),目的是在每日、每周或每月報告的基礎(chǔ)上,就你感興趣的主題或問題提供一份詳細(xì)的電子化描述。”
MicroTech公司Social Recon產(chǎn)品全部采用數(shù)字格式管理并解析數(shù)據(jù)。這包括不需要手工標(biāo)記完成的主題和相關(guān)搜索,并能克服由于全球依存度日益提高帶來的語義和語言問題。“例如,人們常常使用不同的詞語(不同的語義和語法)表達(dá)相同的想法,”希門尼斯解釋說。
轉(zhuǎn)載請注明:北緯40° » 美軍如何從社交媒體中提取情報
