妥善管理的大量資料對包括軍事在內的許多行業都是福音。如果不知道何時,何地以及在什麼資源上進行部署,就不可能進行有效的軍事行動。因此,軍事大資料可以幫助國防領導人做出更好的決策,前提這些資料不是" 黑暗資料"。
在1997年的視覺化IEEE會議中,術語"大資料"被提出。
當時,計算機記憶體以兆位元組為單位,最強大的記憶體為128 MB。由於科學家之間通過網際網路共享資訊,使得越來越多的資料以越來越快的速度湧現,因此開發處理大資料的技術面臨著如此巨大的壓力也就不足為奇了。
現在,最便宜的智慧手機可在1 GB(1000 MB)的記憶體上執行,因此不斷增長的資料量已不再像以前那樣成為問題。用今天的話來說,2013年的全球資料量為4.4 ZB(1 ZB = 44萬億GB),到2020年,這一資料可能會增加到44 ZB或更多。但是,先進的計算機硬體使資料收集和儲存相對便宜又容易。此外, 人工智慧(AI)和機器學習(ML)技術的最新發展,分析也變得更加易於管理。
但是,在軍隊中,大資料的收集經常引起爭議。最近的一個喧鬧話題涉及使用開源機器學習平臺收集視覺資料。在這種情況下,無人機是用於資料收集或軍事術語,情報收集的方法。抗議本身並不是關於資料,而是針對ML進行攻擊的潛在用途。
這種對軍事技術的突然使用是一種奇怪的事情,因為將其用於情報收集並不是什麼新鮮事。當然,今天使用的方法是不同的,但是資料本身的性質和重要性卻沒有。
軍方繼續與 情報界一起收集各種學科的情報,這些學科可能被有趣地稱為" INTS"。IC下有17個組織,但它們在軍事領域的道路在以下學科中相交:
· HUMINT(人類情報)
· GEOINT(地理空間情報)
· SIGINT(訊號智慧)
· OSINT(開源情報)
HUMINT:人類情報人類情報收集(HUMINT)通過與人的私人接觸來收集資訊。資訊採取檔案,照片,數字檔案和其他材料的形式,這些資訊是通過非官方渠道祕密獲得的,或者是通過外交或領事人員公開獲得的,以及與外國官員的授權通訊。軍隊還可能通過對敵人的訊問或旅行者的彙報來獲取情報。
大多數人將HUMINT與間諜活動聯絡起來,有時被戲稱為世界第二古老的職業,他們大多是正確的。間諜在該學科的情報收集中仍繼續發揮重要作用,儘管它與其他廉政局相比更為互補。例如,人員可以提供使SIGINT操作員遠端訪問系統的程式碼。
HUMINT在技術進步這一天的重要性也與環境相關,這是基於AI的監視可能會錯過的。在地面上有人可以在評估軍事目標的有效性和觀察其發展過程中提供有價值的(人類)見識。
通過HUMINT收集的資料通常採用不同的格式,包括模擬和數字格式。它可能是音訊,視訊,文字或影象,必須經過分析才能將其與通過其他學科收集的資料整合在一起。基於AI的軟體可以標記,組織和分析HUMINT資料,目前軍方正在評估的此類軟體之一是雷神公司的FoxTen。
但是,AI可能很快會在對抗跟蹤技術方面發揮更積極的作用,其中一些技術是專門為間諜設計的,而另一些則是不為人知的工具。 中央情報局(Central Intelligence Agency)正在進行多個AI專案,包括想出一些方法來欺騙跟蹤裝置或繪製敵對或未知地區監視攝像機的位置。
GEOINT:地理空間情報根據美國法典, 地理空間情報是指使用和研究影象和地理空間資料來解釋,審查和以視覺方式表示地面特徵和活動。簡而言之,GEOINT包括從空中,地面或水下拍攝的影象,視訊和其他視覺表示中收集的所有情報。
從軍事意義上來說,GEOINT的價值在於提供物體活動的精確位置,解釋其含義,併為其提供有助於做出軍事決定的框架。視覺資料通常來自衛星,無人機(UAV),自主水下航行器(AUV)和其他測量技術。
本節中特別提到的是無人機的使用,這種無人機通常被稱為無人機。軍方一直在使用無人機蒐集情報,以支援軍事人員和運營多年。
但是,通訊速度,儲存容量和機器視覺軟體自主操作無人機的能力提高,導致資料過載。
軍方庫存中有8,000多架無人機,並且使用效果良好。員工每天必須經歷大約1600個小時的錄影,這還不包括影象。資料對地面的士兵和總部的指揮官來說是無價的,但前提是分析是準確和及時的。
AI和ML演算法可以比人類操作員更快,更徹底地分析視訊並檢測威脅。這是Project Maven的基礎,Project Maven當前使用基於TensorFlow的平臺進行無人機鏡頭的預測分析。在Google決定不續簽AI開發專案之後,五角大樓求助於初創公司Anduril Industries,以開發用於軍事無人機的感測器融合平臺。
根據該公司的網站,使用萊迪思AI平臺,"只有最終資訊才傳回給使用者。這使功能強大的計算機的大規模可擴充套件網狀網路可以進行數字處理,而無需部署伺服器場或命令中心。"
SIGINT:訊號情報訊號情報是有關通過攔截訊號和傳輸獲得的外來目標的動作,目標和能力的資訊。根據傳輸型別,存在SIGINT的三個子集。COMINT來自通訊系統,雷達和武器系統來自ELINT(電子情報),以及正在開發或測試中的武器系統來自FISINT(外國儀器訊號情報)。
國家安全域性(NSA)通常使用各種方法來蒐集有關恐怖分子,組織以及具有國際或外國協會的人的SIGINT,但往往 比其他任何方式都使用無人機。只有 在美國政府正式要求時才這樣做。NSA會將原始資料轉換,解碼和分析為非NSA分析人員(例如CIA和IC中的分析人員)可用的形式。這些機構將NSA資料與其他廉政局的資料相結合,以描繪出完整的圖景。
SIGINT一直有足夠多的資料,用以工作,因為它具有這樣的來源廣泛的陣列。電話對話,電子郵件,無線電波,衛星傳輸,無線連線甚至鍵盤振動一直在持續進行,為NSA提供了大量資訊。
面臨的挑戰是從大量的隨機訊號中挖掘出有價值的資訊核心。所述收集過程包括首先從對話的潺潺提取某些型別的訊號從訊號或談話層。提取後,SIGINT分析人員將篩選候選專案,以根據一組引數選擇要保留的專案。然後,國家安全域性儲存這些選定的專案,並將其傳送給請求機構以進行進一步分析。
這個過程是艱苦的,並不總是盡其所能。IC不可避免地會尋求先進的AI和ML技術來使此過程變得更快更好。SIGINT的主要目的是防禦。知道敵人的位置,意圖和能力可以大大防止對士兵和平民的傷害。
但是,研究人員越來越希望SIGINT做其他事情。一種是提供見解,以幫助他們從收集到的資料中準確預測未來事件。
IC研究部門"情報高階研究計劃活動"(IARPA)與學術和商業領域的資料科學家和ML工程師聯絡,以開發連續的,自動化的SIGINT分析技術。 該獎項被稱為" 水星挑戰",將用於有效地"預測涉及軍事行動,內亂或傳染病的事件,特別是在中東和北非講阿拉伯語的國家發生的事件"的演算法。
此外,先進的迅速崛起 的網路和電磁活動(CEMA)和電子戰從對手迫使陸軍 收斂的訊號情報,網路和電磁系統整合到一個平臺: 地面層的智慧系統。陸軍正在積極尋求加速整合的建議,包括開發機器學習軟體以減少工作量。
SIGINT技術的另一個潛在用途是擔當更積極的防禦角色。檢測,識別和評估訊號威脅級別(例如地對空導彈雷達)的能力可以拼寫出任務成功與失敗之間的區別。
該波音EA-18G咆哮者保持士兵干擾敵方雷達訊號的安全。有計劃通過整合可以更快地檢測訊號並更準確地分辨出友好和敵對訊號之間的區別的AI軟體,使Growler在防禦方面更加有效。
SIGINT收集和分析的世界不再是關於攔截訊息和破解程式碼以供他人採取行動。在完善的資料和機器學習的幫助下,SIGINT迎接了迅速發展的電子戰的挑戰。
OSINT:開源情報正如該術語所暗示的那樣,開源情報是從公開或可公開獲得的來源收集資料以用於特定目的的開發。這是OSINT的非常寬泛的定義,而在存在OSINT的50年中,很難找到更詳細的定義。據 RAND Corporation說,原因是公開可用的資料來源一直在變化。自從Internet使用變得普遍並且社交網路使用發生爆炸以來,這一點變得更加明顯。
多年來,OSINT的來源不斷髮展。在第一次迭代中,最多產的OSINT來源是電視,廣播和印刷媒體。過去,人工操作人員會手動瀏覽這些資料來源。後來,情報機構使用了商用的現成(COT)軟體來收集,清理和分析OSINT資料。
傳統媒體仍然是OSINT的來源,但是資料收集的真正動力是網際網路。即時訪問隨時可用並不斷更新的資料有利於情報收集操作。這些內容包括部落格,線上報紙,社交網路,視訊流服務,論壇和其他使用者提供的內容,以及網站後端的隱藏寶石。
問題在於可用資料的絕對數量和複雜性。來自Internet的資料流具有細微的層次,分析人員必須執行所有操作,從事實檢查到情感分析,並始終牢記資料的上下文。
要 為這項工作的艱鉅性增加視角,請考慮社交媒體。Twitter使用者平均每天上傳6.56億條推文,Facebook使用者每天釋出43億條訊息。這只是來自兩個社交網路的資料。再加上每天Google的搜尋量(52億),觀看的YouTube視訊(每分鐘400萬),釋出的部落格文章,這為軍隊提供了大量的資料。
在軍事領域,分析人員必須能夠過濾這些資料流,以識別和分類對軍事戰略和行動有任何用途或影響的所有事物。這可能與某些國家,特定個人,高風險人群,武器等有關。他們必須在人類行為的背景下並實時地徹底做到這一點。
沒有人工協助,對於操作人員來說,這顯然是不可能完成的任務,IC也知道。為了滿足這一需求,中央情報局目前正在研究 使用AI進行OSINT的幾個專案,而不僅僅是進行分析。它計劃使用AI軟體和自然語言處理演算法來系統地瀏覽社交網路和其他OSINT來源的資料流。該軟體將僅選擇相關專案,從理論上講將OSINT收集器的工作量減少75%。
這個想法是在5年的時間裡與私人公司合作進行OSINT實驗以及使用機器學習進行大資料收集和分析。中央情報局於2018年5月宣佈了梅薩維德角專案,但該提案目前尚無更新。
然而,商業部門並未如此謹慎。像Google這樣的公司已經擁有專門設計用於處理大資料的工具和API。
軍事中的大資料來自許多來源,資訊過載是一個非常現實的問題。人工智慧和機器學習可能是一種有效的解決方案,但是要比重新發明輪子更了解力量。尋求商業和學術機構處理大資料是軍隊採取的合乎邏輯且最具戰略意義的舉措。