【摘 要】 多種安全運營產品被應用在本地或云端,傳統的安全檢測方式在大數據和云計算的環境中逐漸顯露出局限性,基于行為分析的安全檢測方法迅速發展,但仍存在誤報率高、缺乏上下文關聯、大量依靠人工評判等缺陷。本文針對上述問題提出了一種利用外部知識庫、自身安全數據和智能算法深度結合的威脅識別、評價體系。該體系融合了高速發展的知識圖譜有關技術和圖神經網絡技術,兼具實用性和創新性。
【關鍵詞】 威脅知識庫 知識圖譜 圖神經網絡 風險評估
1 引言
目前,安全信息事件管理(SIEM)系統、用戶實體行為分析(UEBA)系統,以及擴展檢測和響應(XDR)系統被越來越多的組織應用在本地或云端。大量實踐表明,基于行為分析的安全檢測方法在大數據和與云計算環境中越來越有優勢。隨之而來產生了一系列重要問題:行為的異常就等于安全威脅嗎?海量日志中的威脅如何檢測?識別出攻擊行為風險級別如何評判?
由于缺乏對異常行為的進一步研判、潛在威脅的挖掘、合理的威脅攻擊評判方式,造成了現有安全產品棘手的通病誤報率高、結果缺乏上下文邏輯關聯、分析大量依靠人工。這些問題會嚴重影響用戶的實際體驗,大幅降低安全系統的可用性,并增加組織安全運營中心(SOC)安全人員的工作負擔。如何提高安全系統的報警準確率,已經成為行為分析關聯安全檢測系統迫切需要解決的問題,一般的解決方法包括以下3種。
(1)行為基線調整:采用動態行為基線,根據用戶和實體近期行為數據對其基線定期更新。
(2)關聯分析結合專家人工研判:根據預先設定好的規則,關聯安全事件信息,輔助安全專家人工分析,對系統產生的異常行為進行研判。
(3)風險打分排序:對異常行為進行風險評估,累加其風險評分并進行排序,分析人員優先關注排名較高的用戶或實體行為。
上述方法雖然在一定程度上緩解了誤報率高、結果缺乏上下文邏輯關聯、過度依靠人工等問題,但都只是在某一維度上的片面優化或是以犧牲系統邏輯性、實時性等性能為代價的。
本文提出了一種利用外部知識庫、自身安全數據和智能算法深度結合的威脅識別、評價體系,解決誤報率高、人工分析成本高且及時性差、風險評估缺乏聯動等關鍵問題。利用本文研究的體系可采用多種智能算法,助力網絡安全智能化。
2 研究內容和價值
2.1 研究內容
本文對網絡安全智能化技術深入研究,首先根據對抗戰術技術通用知識庫(ATT&CK)、結構化威脅信息表達(STIX)等多種安全知識框架,研究用于威脅檢測和攻擊鏈識別的知識庫,即威脅知識庫。其中包括威脅攻擊基本映射策略、威脅攻擊場景與模式。在威脅知識庫的輔助下研究網絡安全智能化實踐,探索基于圖神經網絡技術的威脅攻擊鏈智能識別;有機結合威脅模式、攻擊事件研究并設計風險場景,構造用于風險評估分析的風險因素模型,利用蒙特卡洛或其他隨機方法進行評估計算。
2.1.1 威脅知識庫
威脅知識庫中包含基于安全知識框架的映射策略和威脅攻擊模式,如圖1所示。通過對ATT&CK安全知識框架中網絡攻擊技戰術的研究,基于用戶和實體行為構建關聯的“行為到攻擊技戰法(TTP)”的映射關系。將ATT&CK安全知識框架引入并應用到多種產品威脅識別、威脅情報方面,歸納基于ATT&CK安全知識框架的映射策略:
(1)內部威脅與ATT&CK安全知識框架映射策略;
(2)外部威脅與ATT&CK安全知識框架映射策略。
通過對現有威脅攻擊日志數據和多方威脅情報的分析,提煉出攻擊模式的本體模型:
(1)研究關聯多方日志數據歸一化,同時分析日志中與本體模式對應成分,形成語義連貫、符合邏輯的攻擊示例;
(2)從眾多攻擊示例中提取關鍵攻擊步驟與威脅上下文,形成譜圖化攻擊模式和威脅場景。
圖1 威脅知識庫的作用
2.1.2 威脅智能化識別
利用專家預置的威脅攻擊鏈模式,實現基于知識圖譜和圖神經網絡技術的威脅攻擊鏈智能識別,重點研究內容如下:
(1)基于威脅知識庫的本體模型構建,從多方日志中構建用戶知識圖譜,現有的日志多為結構化或半結構化,因此研究中采用知識融合的方式構建圖譜,并利用知識加工迭代完善圖譜數據內容;
(2)基于圖神經網絡的子圖匹配技術,采用已有帶標注數據訓練深度學習模型,訓練后的模型可智能識別威脅攻擊鏈。
2.1.3 風險因素評估模型
多種威脅場景下多樣攻擊鏈會造成不同的損失和影響,評估威脅往往會消耗安全人員大量時間和精力,且人工評估包含較多的非量化的結論。為了有效管理風險,需對風險進行量化評估。
根據對現有風險因素模型和風險評估方法的調研,本研究內容和待解決問題包括以下3點。
(1)構建適用于本研究的信息系統風險因子的分類法與本體模型。參考常用的標準,如《ISO 31000:2018 風險管理指南》,《美國標準技術研究院特別出版物 800-37》,《OpenFAIR風險分類學》[7]等。
(2)設置風險場景。研究內容主要為利用威脅場景、攻擊鏈和風險因子本體模型,識別風險場景。從現有資產的主要利益相關者視角出發,研究并設計包含威脅事件和攻擊行為的風險場景,場景的關注點落在損失和影響。
(3)明確基于統計和隨機方法的風險分析方法論和流程。研究在給定風險因子本體模型和風險場景后,通用的風險分析評估流程包括場景和風險因素分解、風險因素評價策略、基于隨機方法的量化估算、緩解措施(控制項)評價等一系列步驟。
2.2 研究價值
本文研究如何利用ATT&CK安全框架,挖掘數據中的威脅線索,對抗愈發隱匿和嚴重的內外部威脅行為,達到持續降低組織的數字化運營風險的目的。
目前,雖然在諸多威脅感知場景下,學界和產業界利用統計機器學習的威脅分析方法取得了重要的突破,但在面對高度動態復雜的網絡行為分析時,感知層輸入往往缺乏有安全語義的規范化建模,數據層異常而非真實惡意攻擊的誤報情況難以避免。此外,多維度單點的感知分析結果,仍需要專家深度參與研判與關聯分析,才能完整還原攻擊行為全貌,限制了高級持續攻擊(APT)、內部威脅等高級復雜攻擊技戰術的分析自動化水平的提升。本研究通過構建威脅知識圖譜,將語義孤立的多元異構信息聯系起來,并利用圖神經網絡嵌入技術發現海量日志中的潛在攻擊鏈。
攻擊鏈的識別可為安全人員提供重點關注對象和相關上下文信息,同一類型場景下的不同攻擊鏈和不同場景下的相似攻擊鏈都需要評估,以便優先處理更加緊急的安全事件。本研究提出風險因素模型,即選取定義一致的風險詞匯表及各風險因子的關系,可以幫助組織的安全人員進行威脅處理優先級排序、后續運維和風險管理工作,并有效地向決策層傳遞和對比風險評估結果。
3 研究方案與說明
本研究利用ATT&CK安全框架中的戰術、技術等方面的知識庫對異常行為進行研判,并使用深度學習和機器學習等多種手段檢測并擴充威脅攻擊行為,最后通過風險因素模型給予量化評估,最終達到對威脅識別、評判的目的。大體流程如下:
(1)將安全系統產生的異常、警報與ATT&CK安全框架中的戰術、技術進行映射匹配,對系統所產生的異常和警報作進一步研判,緩解安全系統高誤報率的問題;
(2)通過時間維度審視被關注對象的所有離散行為、結合每個離散的異常行為與ATT&CK安全框架中的技戰術的映射匹配情況,以及相關聯的一系列連續上下文行為,識別威脅攻擊鏈,調查隱藏在異常和警報背后的安全威脅;
(3)根據風險因素模型和風險評估算法,量化威脅攻擊鏈帶來的影響,以便安全人員優先處理高優先級事件。
首先使用威脅知識庫把異常行為映射到ATT&CK安全框架中的戰術、技術,安全人員可以從海量異常報警中進一步識別出真正的安全威脅,顯著降低安全系統的誤報率,如圖2所示。但是,網絡攻擊往往是一系列行為組成的,只判斷離散的惡意行為并不能真正阻止攻擊者,從根本上消除安全威脅。為了更好地應對網絡攻擊,實現對安全威脅由檢測分析、編排響應到取證溯源的全生命周期的管控,需要結合多種安全框架建立威脅攻擊鏈模型,并在其基礎上利用人工智能、知識圖譜與知識推理的關聯技術,擴展當前威脅知識庫。
圖2 異常行為到ATT&CK安全框架的映射
建立威脅知識庫之后,無法利用其中知識直接識別日志中的攻擊鏈,需要利用數據融合、實體對齊、知識推理、質量評估等技術把多方安全日志轉換為用戶行為圖譜。該圖譜作為本體模式指導下的數據層,與知識庫中威脅攻擊模式進行匹配,用于探查攻擊者的攻擊技術和過程。
在用戶和實體的一系列時序行為中查找隱藏威脅攻擊鏈,難點在于行為中混合了正常行為和異常行為,很難將其與一系列的攻擊鏈模式、模型完全精確地匹配。所以采用近似求解的子圖匹配方法更為合適,如基于深度學習的一系列圖嵌入算法和圖匹配算法,包括圖神經網絡(GNN)嵌入模型、圖卷積網絡(GCN)嵌入模型、子圖匹配網絡模型等,可以將圖譜中的節點連同語義信息一同轉換到低維的向量空間,并通過多種相似度學習算法達成攻擊鏈的智能學習,如圖3所示。
圖3 基于圖神經網絡的子圖匹配方案(NTN:神經張量網絡;ATT:注意力矩陣;conv:卷積)
最后,通過建立風險因素模型并評估威脅攻擊鏈,達到威脅優先級排序的目的:
(1)識別風險場景,在其內定義并描述資產、威脅、控制項、影響/損失等;
(2)設計明確定義的風險因素分類法,如圖4所示,該步驟可以使風險評估信息有效地傳遞、對比并輸出報告,具體可參考知名機構所出版的標準;
(3)構建風險因素模型,該模型利用上一步定義風險因素分類法,設置一系列風險因素和子因素;為了提升評估精度,研究中選取不同子因素聚合到上級風險因素的函數,聚合函數會采用概率分布、鏈式聚合、層級聚合等多種形式;
(4)測量并對風險因素估值,研究中采用蒙特卡洛或其他隨機方法;利用統計的原理進行輔助分析的技術還需在實驗中進一步選型。
圖4 風險因素分類法示例
4研究特色與創新點
4.1 威脅知識庫的特色與優勢
本研究所構建的威脅知識庫具有以下4個方面的特色與優勢。
(1)成熟的安全框架理念:將ATT&CK安全框架應用于威脅檢測、分析及響應。
(2)威脅輔助分析與智能識別:把異常行為與ATT&CK安全知識框架中的技戰術進行匹配映射,精準識別威脅,并利用ATT&CK安全框架中的知識輔助分析。關聯各個異常行為,挖掘隱藏在其背后的完整攻擊意圖,并利用人工智能領域的相關算法,智能識別安全威脅攻擊鏈。
(3)降低誤報率:與傳統威脅檢測系統相比,基于ATT&CK安全知識庫中的技戰法(TTP)對系統異常和警報進行映射,可大幅度降低系統異常行為報警的誤報率。
(4)已有經驗知識再利用:預置各種攻擊鏈模式、模型,智能化匹配識別系統行為數據中隱藏的威脅攻擊鏈,挖掘攻擊者的真正攻擊意圖。
4.2 圖神經網絡的子圖匹配算法特色與優勢
圖神經網絡的子圖匹配算法特色與優勢主要體現在以下2個方面。
(1)結合新知識、新理念、新技術:構造以日志數據為基礎,引入專家知識的本體模型;將用戶行為與威脅攻擊模式圖(譜)化,再利用基于圖神經網絡子圖匹配技術,把復雜多樣攻擊鏈識別過程轉化為深度學習過程。
(2)節點特征向量嵌入不同抽象層級的特征空間:通過把日志數據和威脅模型中部分實體映射到更高抽象層級的ATT&CK威脅框架內,可給圖譜中節點的特征向量提供額外維度且不同抽象層級的信息,結合日志中已有的實體特征信息,可加速節點匹配過程,提升子圖匹配模型的性能和匹配成功率。
4.3 風險因素模型特色和創新
本研究所采用的風險因素模型具有以下2個方面的特色和創新。
(1)從風險的角度度量攻擊事件和行為:威脅與攻擊鏈識別從網絡空間安全的角度出發,注重攻擊者的行為序列及攻擊產生的前因后果。而風險因素模型從風險管理的角度考慮多種安全域和控制項,結合威脅頻率、攻擊強度、資產損失等因素綜合且全面評價攻擊事件,把攻擊知識領域和風險管理領域有機結合。
(2)采用概率和統計結合的量化評估流程:建立風險因素關聯的概率模型,再結合攻擊鏈識別技術,風險因素模型由靜態轉為動態,不但可根據實際識別結果有效區分高頻低損失威脅和低頻高損失威脅,還可根據實際業務集成于多種風險場景中。研究采用蒙特卡洛模擬算法模擬統計分析過程,可解決因子關聯的復雜概率模型抽樣困難的問題。
5 結語
利用基于ATT&CK和STIX安全框架構建威脅知識庫可以在很大程度上提升各類基于行為的安全系統的檢測精度,并且可以深入挖掘隱藏在一連串異常行為背后的威脅攻擊鏈,從而分析攻擊者的真正意圖。威脅知識庫構建的難點在于如何更好地構建基于ATT&CK安全框架的映射策略、識別威脅攻擊鏈這兩方面。對于映射策略而言,需要安全人員對ATT&CK安全框架具有較深入的理解,并且了解自身所掌握的數據和具體需求。根據實際使用效果不斷調整映射策略中不合理的映射關系。風險因素模型對攻擊鏈的風險評估,讓智能算法的應用更加可行。攻擊鏈可能造成風險在不同場景中有很大不同,結合威脅場景、風險因素模型,可有效度量攻擊鏈的風險,幫助安全人員優先響應重要事件。
(原載于《保密科學技術》雜志2023年1月刊)