在《美國國家安全局如何分析手機(jī)通話數(shù)據(jù)》一文中我們了解到“圖譜分析”是NSA分析手機(jī)用戶通話數(shù)據(jù)最重要的技術(shù)手段,據(jù)NSA官員透露的文檔,僅Verizon的用戶通話數(shù)據(jù)的圖譜分析項(xiàng)目,規(guī)模就已經(jīng)超過了Facebook。
除了結(jié)構(gòu)化程度較高的通話數(shù)據(jù)外,NSA代號(hào)PRISM的超大規(guī)模數(shù)據(jù)挖掘項(xiàng)目能直接監(jiān)測(cè)Google、Facebook、微軟和蘋果等九大互聯(lián)網(wǎng)IT企業(yè)中央服務(wù)器中的各種結(jié)構(gòu)化和非結(jié)構(gòu)化用戶數(shù)據(jù),被提取分析的數(shù)據(jù)包括音頻、視頻、圖片、電子郵件、文檔和聯(lián)系日志。
毫無疑問,NSA在分析海量非結(jié)構(gòu)化數(shù)據(jù)時(shí)勢(shì)必要用到大量大數(shù)據(jù)分析技術(shù),據(jù)《華爾街日?qǐng)?bào)》報(bào)道,數(shù)據(jù)庫系統(tǒng)、機(jī)器學(xué)習(xí)和Hadoop基礎(chǔ)架構(gòu)三大技術(shù)在NSA的互聯(lián)網(wǎng)大數(shù)據(jù)分析中發(fā)揮了非常重要的作用。
以下是文章內(nèi)容全文,由騰訊科技翻譯:
僅僅在五年之前,諸如美國國家安全局(National Security Agency,NSA)這樣的政府機(jī)構(gòu)要想通過關(guān)鍵詞的方式高效率地分析數(shù)百萬份電話、文本消息和在線聊天記錄,簡(jiǎn)直是不可能完成的任務(wù)。不過目前,一系列新技術(shù)的使用則讓NSA擁有相對(duì)充分的人力和財(cái)力做到這一點(diǎn)。尤其考慮到,這些關(guān)鍵詞最終有可能避免未來針對(duì)美國恐怖襲擊的放生。
這些新技術(shù)能夠在一個(gè)單獨(dú)的數(shù)據(jù)庫里存儲(chǔ)大量不同類型的數(shù)據(jù),而且不需要使用造價(jià)昂貴的硬件設(shè)備就能夠?qū)崿F(xiàn)數(shù)據(jù)的高速處理,同時(shí)還無需數(shù)據(jù)分析專家提前設(shè)定假設(shè)條件。
哈佛商學(xué)院客座教授、數(shù)據(jù)分析專家湯姆
新聞熱點(diǎn)
新聞爆料
點(diǎn)擊排行