樹人論文網一個專業的學術咨詢網站?。。?/div>

基于語義匹配與組合的模型重用技術研究

來源：樹人論文網發表時間：2021-10-13

簡要：摘要：為解決作戰體系概念模型與作戰體系仿真想定的數據壁壘，對仿真想定的智能映射與模型重用技術進行研究。采用 DOM 技術對概念模型進行解析。基于本體理論構建作戰領域知識

　　摘要：為解決作戰體系概念模型與作戰體系仿真想定的數據壁壘，對仿真想定的智能映射與模型重用技術進行研究。采用 DOM 技術對概念模型進行解析?；诒倔w理論構建作戰領域知識庫，定制網絡爬蟲以建立領域同義詞庫。通過 SWRL 規則庫，調用推理機實現語義層面的關系推理。設計智能匹配算法，將語義關系映射到仿真模型的組合關系。采用 DOM 技術確定對象節點，生成仿真平臺可執行的想定文件，實現了系統仿真模型的組合重用，同時基于上述流程搭建了作戰體系仿真想定智能生成軟件平臺。

基于語義匹配與組合的模型重用技術研究

　　田星雨; 曾廣迅; 高云博; 龔光紅; 李妮，系統仿真學報發表時間：2021-10-13

　　關鍵詞：語義組合;作戰體系;模型重用;仿真想定;語義匹配

　　引言

　　隨著科學技術的快速發展，信息化軍事背景下的未來戰爭不再局限于少量作戰單元之間的簡單作戰，而是趨向于作戰體系之間的對抗。體系因此成為了國內外學者的重點研究內容。

　　體系設計全生命周期，包括體系結構設計、體系建模仿真、體系仿真結果評估等三部分。作戰體系概念模型作為體系結構設計結果，從頂層角度為建模仿真人員提供了作戰實體、作戰活動的抽象描述。但由于作戰體系概念模型與作戰體系仿真想定在數據粒度、表現形式上的差異，二者無法直接實現數據復用。同時，目前國內尚未形成成熟的仿真想定系統，缺乏從概念模型到仿真想定的智能化映射軟件。面對軍事領域仿真的多樣性、復雜性，仿真想定生成領域對想定生成的智能化、想定模型的可重用性提出了越來越高的要求。

　　模型重用問題是仿真領域的前沿課題，被列為仿真領域最具挑戰性的 4 個研究領域之一[1]。通過對商用軟件二次開發，將模型信息分類，能夠實現仿真模型的快速建模，但其缺點是針對特定仿真軟件，適用范圍較小[2]。目前針對模型重用已有許多標準和工具，但在作戰仿真領域的具體應用較少。

　　因此，面向作戰領域開展仿真實體與行為模型組合重用的研究具有重要意義。本文通過對作戰領域武器裝備、作戰行動概念進行表示，基于本體理論建立領域知識庫，通過智能映射算法與語義推理設計，實現概念模型到仿真想定的映射，完成概念模型知識的重用、系統原有仿真模型的組合重用，降低體系設計開發成本，有效縮短體系設計周期。

　　1 基于本體的作戰領域知識庫構建

　　基于 DoDAF 2.0 理論，明確概念模型解析的整體路線，采用 DOM 技術對.xml 格式的作戰體系概念模型文件開展解析，通過 DOM 樹的生成與查詢，實現指定類型數據的篩選。分析解析數據與概念模型中節點的映射關系，確定概念模型與仿真想定之間可進行復用的作戰概念數據，即概念模型中的武器裝備、作戰行為數據。由于命名形式、數據語義、數據粒度等方面的差距，數據無法直接映射至仿真想定，需建立作戰領域知識庫，為后續匹配、語義推理提供知識支撐。

　　1.1 基于本體的作戰領域知識庫構建流程

　　本體是指揮信息系統與作戰仿真系統的基礎。本體的概念最初在哲學領域引入，其含義為“對世界上客觀存在物的系統描述”。隨著互聯網、計算機領域技術的逐漸發展，本體受到了諸如語義網 [3]、知識工程[4]、生物醫學[5]和人工智能[6]等多個領域的關注。

　　本體知識庫的構建，是指運用本體技術，基于本體理論構建知識庫系統。關于領域本體構建方法，骨架法和企業建模法首先出現;隨著本體技術的發展，形成了七步法、Methontology 方法、 KACTUS 工程法等本體構建方法。這些方法對開展本體構建工作具有指導意義。其中，應用較為廣泛的七步法，是斯坦福大學提出的一種自頂向下的本體構建方法。七步法的本體構建步驟明確清晰，包括本體分析、合并、概念添加等本體構建過程，對構建作戰領域本體具有較強的指導意義。

　　基于本體的知識庫構建思路通常分為自頂向下、自底向上兩種。自頂向下方法含義為，從頂層概念開始對知識庫進行細化，搭建良好的層次分類結構，再對本體庫進行底層本體添加;而自底向上方法含義為，首先從底層本體入手，對本體進行歸納組織，提取底層概念，之后通過逐步抽象提取上層概念，整合形成完整知識庫。

　　由于不同本體構建人員的專業領域知識存在差異，為構建無歧義的領域本體，實際構建更多采用自頂向下、自底向上思路相結合的方式。根據本體的具體應用和作戰領域特點，本文提出作戰領域本體構建的流程方法，其具體過程如圖 1 所示。

　　手動構建領域本體庫的方法依賴于本體開發工具，用于進行本體的構建、存儲、查詢、推理等。 Protégé是一個開源本體編輯器，本文采用 Protégé 本體構建軟件，對上層本體進行手工構建。

　　1.2 本體構建

　　1.2.1 自頂向下的本體構建

　　(1)確定本體范疇和構建目的

　　本文所要構建的領域本體，具體范圍為軍事領域的武器裝備、功能組件、作戰行為及其他上層概念。作戰領域本體的構建目標為，以結構化形式對作戰領域知識進行表示，對作戰領域中武器裝備、作戰行動概念及概念間相互關系進行描述，實現領域知識的重用與共享。

　　(2)確定領域核心概念集

　　設計領域本體結構模型的基礎，在于識別作戰領域重要術語，并據此建立領域主題概念集。針對本文面向的實際應用需求，作戰領域頂層概念涵蓋武器裝備、功能組件、作戰行為、作戰環境、作戰組織等概念，但僅對其中部分概念進行滿足應用需求的關系描述與推理。

　　(3)建立概念層次結構

　　實體概念，用于描述作戰領域武器裝備的具體類別劃分與層級關系。功能組件概念是實現作戰領域具體功能的最小組件，如雷達、導彈等本體。參考軍事數據網站提出的層級結構，在本文知識庫中建立武器裝備本體知識結構。

　　在作戰領域，對作戰行為進行分析，主要從兩種粒度的行為進行考慮：動作和任務[7]。

　　動作：即原子行為、原子模型，是最小的、不可再細分的行為概念，定義為任務實施過程中的步驟或工序;

　　任務：即組合行為、組合模型，由原子模型組成。任務是具有明確作戰意圖的軍事行動，定義為執行作戰命令的過程。任務可由若干個動作組成。

　　在《軍語》、作戰條令、條例、相關文獻[8]中進行概念獲取，明確作戰行動術語的準確定義。作戰行為可初步分為任務模型與自主行為，其中任務模型根據行為粒度，可分為原子模型、組合模型。原子模型為組合模型的基本組成單元，其又包含多種概念分類。例如機動是為達成一定目的而有組織地轉移兵力或火力的作戰行動。對于兵力機動類型，具體包括開進、合圍、追擊、轉移、疏散、交替前進等行動樣式。

　　(4)定義屬性及屬性約束

　　對于武器裝備及功能組件，數據屬性即為其各類實際參數，可在已有作戰領域武器裝備本體庫中查詢獲得。對于作戰行為類數據，需要對作戰行為進行時間順序上的約束。

　　對象屬性是對領域本體概念間關系的描述。結合相關調研，對作戰領域頂層概念及其子類的關系概括如表 1，并依此建立對象屬性。

　　(5)進行實例化

　　在自頂向下的手動構建部分，只針對文獻中出現的部分作戰行為描述進行實例添加。

　　至此，在 Protégé中完成作戰領域本體庫初步搭建。該本體庫面向作戰領域相關概念，共包含 328 個子類、32 個實例屬性、12 個類間關系。本體庫中初步添加 85 個實例，用于對各類作戰行為提供具體描述，如“沖擊類”原子任務模型包括“偷襲”、“火力追擊”、“突擊”等行為實例。

　　此時，基于自頂向下構建思路，已初步完成本體庫構建。由于作戰行為存在著語義描述上的多義性與指代不一，需要進一步獲取實例數據，根據底層實例數據進行自底向上的本體庫修正。

　　1.2.2 自底向上的本體構建

　　隨著網絡科技的不斷發展，互聯網成為信息的載體，對其中信息資源進行自動抓取的程序或者腳本也應運而生，它們被稱作網絡機器人、網絡爬蟲。面對特定數量與特定主題的網頁資源，則需要依據網頁資源的加載方式，對網絡爬蟲定制化設計。

　　實驗室已通過網絡爬蟲技術，在軍事網站中進行數據爬取，對數據進行整理，并按照特定組織形式保存于本地 MySQL 數據庫中。數據庫包括 3104 個 aircraft 類裝備型號數據、1754 個 ship 類裝備型號數據、330 個 submarine 類裝備型號數據，最大深度為 5，武器裝備間主要關系為上下位關系，共囊括 5188 種武器裝備型號與具體參數。

　　本文面向開源軍事術語網站定制網絡爬蟲應用程序，通過調用 Requests 庫模擬 Ajax 請求獲取數據，調用 BeautifulSoup 庫解析返回的 HTML 數據，并進行篩選、保存。

　　本文整理了 51 個常見行為術語，以此進行數據搜索與爬取，得到 37032 個搜索詞條，保存于本地 MySQL 數據庫中。結合具體應用需求，調用 Jieba 庫實現術語的詞性標注，結合手工標注，得到了無歧義的作戰行為類實例數據 1212 個詞條。

　　對實例進行手工歸類，確保每個原子行為子類對應于多個作戰行為術語實例。同時，整理形成作戰行為同義詞庫，用于后續實例添加與語義推理。

　　1.3 實例自動化添加

　　龐大的實例數據與其豐富的語義信息，對自動化添加實例的方法提出了較高要求。在對 OWL 文件進行解讀的基礎上，可以通過 re 庫正則字符串，實現 OWL 字符串模式匹配與定位，將 MySQL 數據庫中的結構化數據，轉換為 OWL 代碼段插入本體庫文件中，并通過 Protégé軟件讀取擴充后的本體庫進行正確性校驗。

　　為補充同義詞信息，進行同義詞庫自動化添加，通過實例的 same individual as 實現“同義詞” 的語義表達。

　　圖 2 為 Protégé讀取本體庫文件得到的實例個數及具體信息，添加的實例符合格式要求。

　　至此，作戰領域知識庫的本體已構建完成，包含 319 個概念(類)、49 種關系、84 種數據屬性和 5538 個實例。添加的大量實例及其屬性，作為對本體庫的補充，構建形成了作戰領域知識庫，既是對知識庫的豐富，也為后續進行語義匹配、規則推理提供了數據支撐。

　　2 仿真模型智能映射算法的實現

　　完成作戰領域知識庫搭建工作后，需要通過語義推理，對知識庫中本體的組合、對應關系進行推理補全。之后通過匹配算法的運行，將作戰體系概念模型中的待處理武器裝備、作戰行為數據映射至作戰仿真推演平臺模型庫中相似度最高的仿真模型。針對不同類別數據的實際匹配需要，本文分別研究了不同的匹配方法。

　　2.1 基于 SWRL 規則庫的語義推理方法

　　知識圖譜是一種可視化的圖網絡，由概念、實體、實例、語義關系、屬性、約束條件組成。在知識圖譜中，概念、實體、屬性或屬性值通過結點表示，概念、實體的屬性或關系通過結點連線表示。作戰領域知識庫旨在構建面向作戰仿真的知識圖譜，為作戰領域提供一種面向作戰領域仿真模型體系的、顯式的知識組織模型與表示。

　　在本文以自底向上、自頂向下相結合的方式構建的領域知識庫基礎上，本節給出基于知識圖譜推理的模型語義組合方法，基于語義網規則語言(Sematic Web Rule Language, SWRL)，通過定義規則，實現本體的語義組合。

　　本文搭建的作戰領域知識庫中，SWRL 規則具體包括以下幾個類型：

　　(1)任務的執行者

　　該類型推理執行的前提是，存在組合模型(?CB)與作戰組織或實體(?OPT)，且二者存在執行(isOperatedby)關系。基于上述條件，推斷出(?OPT, hasTask, ?CB)，即作戰組織或實體(?OPT)與組合模型(?CB)存在 hasTask 關系。

　　(2)子任務的相同執行者

　　該類型推理執行的前提是，存在原子模型(?PB1)與(?PB2)，且兩者與同一實體或作戰組織(?En)存在執行(isOperatedby)關系。基于上述條件，推斷出(?PB1, same_operator, ?PB2)，即兩個原子模型(?PB1, ?PB2)對應于相同執行者。

　　(3)任務組合

　　該類型推理執行的前提是，存在組合模型(?CB)與原子模型(?PB)，且兩者與同一實體或作戰組織(?En)存在執行(isOperatedby)關系。基于上述條件，推斷出(?PB, isPartOF, ?CB)，即原子模型(?PB)被組合于組合模型(?CB)中。

　　(4)任務的先后順序或并行

　　該類型推理執行的前提是，存在具有相同執行者的兩個原子任務模型(?PB1)與(?PB2)，且二者均具有數據屬性 occur_time。通過判定兩者數據屬性 occur_time 的大小進行推理，若時間相同，則視為并行任務(parallel);若時間不同，則較早任務為較晚任務的前置任務(pre_drive)，反之為后置任務(after_drive)。

　　(5)實體同級

　　該類型推理執行的前提是，存在不相同的兩個實體(?E1)與(?E2)，且兩者均與相同組織(?Un)存在上下級關系(isSuperior)?；谏鲜鰲l件，推斷兩個實體存在同級關系，即(?E1, sideway, ?E2)。

　　(6)模型組裝

　　模型組裝推理體現模型體系的“任務模型—— 自主行為模型——功能組件”的調用機制。該類型推理執行的前提是，存在分類的實體模型(殲擊機?F)，存在執行任務的類型(巡邏任務屬于平臺運動類型、空戰任務屬于火控類型……)。基于上述條件，推斷出實體必須包含相應的功能組件(六自由度運動、指控、火力控制等)。

　　對于上述推理類型，通過編寫 SWRL 領域規則庫，調用 Jess 推理機，能夠對本體進行語義層面的推理，得到本體的語義組合關系，其本質上即為(頭實體-關系-尾實體)。之后通過智能映射算法，能夠將本體映射至相似度最高的仿真模型，將本體組合、對應關系映射至平臺庫內仿真模型的組合、對應關系，實現系統原有仿真模型的組合重用。

　　2.2 基于領域知識庫的智能映射算法流程

　　以作戰領域知識庫作為知識支撐，設計智能映射算法。概念模型解析得到的仿真模型要素，包含 OV-4 視圖中的底層作戰實體數據、OV-5b 視圖中的作戰活動數據。二者作為智能映射算法的輸入，分別按照不同的映射流程進行處理，如圖 4 所示。

　　2.3 武器裝備映射匹配

　　當解析獲取的待匹配武器裝備數據進行匹配時，若其在知識庫內存在同義詞，則將該武器裝備實體匹配為其同義詞標準型本體，并將標準型作為算法輸入，進行混合式語義相似度計算，將其映射至相似度最高的仿真模型;若其在知識庫內不存在同義詞數據，則通過基于字段的相似度計算，將其映射至相似度最高的仿真模型。

　　2.3.1 基于語義相似度的武器裝備匹配算法

　　作為武器裝備智能匹配過程的核心內容，語義匹配算法將對概念模型數據重用的效果起到關鍵影響。本文采用一種面向作戰領域提出的混合式語義相似度算法[9]，用于實現武器裝備層面的匹配。該算法針對搭建的作戰領域知識庫，考慮路徑距離、本體特征、特征參數值等多方面語義信息，并通過加權結合取得了較好的應用效果。

　　該混合式的語義相似度計算方法如式(1)所示：? 1 2 1 2 1 2 1 2 ? ? ? ? ? ? ? ?? 1 Sim SE SE Sim SE SE Sim SE SE Sim SE SE , , , , ? ? ? p ? ?? ? ?? ? ? ? ? ?? ? (1) 其中? 1 2 , ? p Sim SE SE 為基于路徑距離部分的語義相似度， Sim SE SE ? 1 2 , ? ?為基于本體特征部分的語義相似度， Sim SE SE ? 1 2 , ? ?為基于特征參數值部分的語義相似度，? 、? 、?參數用于衡量路徑距離、本體特征和特征參數值等語義信息所占權重。

　　2.3.2 基于字段相似度的武器裝備匹配算法

　　在實際應用時，由于數據來源的有限性、名稱指代的多樣性，可能出現輸入的武器裝備名稱不包含于作戰領域知識庫的情況。本文基于字段相似度匹配算法，對其進行查找匹配。

　　使用經典 Levenshtein 算法用于武器裝備數據的字段相似度匹配，采用編輯距離衡量字段相似度。編輯距離定義為兩個字符串進行轉換所需的最少編輯次數。該算法的相似度計算公式為： i m sim n m ??? (2) 其具體原理為：記字符串 t 的長度為 n ，字符串 s 的長度為 m ， n m? ， k n m ? ?，前 m 個字符存在 i 個相同的字符。若使用 m i ? 個字符替換操作，能夠使得字符串 t 的前 m 個字符與字符串 s 完全相同。之后對 s 字符串進行編輯，進行 k 次字符插入，最終其與 t 一致。該流程下編輯距離表示為： m i k m i n m n i ? ? ? ? ? ? ? ?可得 m n n i m i ? ? ? ? ?，則最終求得式(2)。

　　從實際操作出發，字符替換可以視作刪除、插入兩步操作，因此若對上述算法進行加權，將刪除、插入操作的 cost 視作 1，將替換的 cost 視作 2 [11]。如此得到改進后的字段相似度計算公式為： 2i sim n m

　　2.4 作戰行為映射匹配

　　結合知識庫中作戰行為術語的具體特點，本文采用 Jaro-Winkler 算法用于計算作戰行為本體之間的相似度[12]。

　　Jaro–Winkler Distance 是一種計算兩個字符串之間相似度的算法，適合計算兩個較短字符串之間的相似度。Jaro Distance 算法計算公式為： 1 2 1 3 j m m m t d s s m ? ? ?? ? ? ? ? ? ? ? ? ?式中， j d 為兩字符串的 Jaro 距離; m 為兩字符串完全匹配的字符數; 1 s 與 2 s 為待匹配字符串; 1 s 與 2 s 為待匹配字符串的長度; t 表示所需換位的字符對數目。

　　Jaro-Winkler 算法在此基礎上，給與起始部分相同的字符串更高的分數，通過對常量 P 的定義，調整前綴匹配的權值。其計算公式為：d d L P d w j j ? ? ? ? ?1 ?式中， w d 為計算得到的語義相似度; j d 為兩字符串的 Jaro 距離; L 為完全相同的前綴字符串長度; P 是一個調整前綴匹配權值的范圍常量。

　　經過調參測試，本文確定 P ? 0.1 時的 Jaro-Winkler 算法，用以進行作戰行為映射匹配。

　　3 作戰體系仿真想定生成方法

　　作戰體系仿真想定智能生成部分，需通過對作戰體系概念模型數據類型與作戰體系仿真想定描述模塊的對應關系的探究，明確作戰體系仿真想定規范文件的生成流程。

　　根據仿真推演平臺導出的想定標準格式，可整理得到作戰體系仿真想定的標準文件模板。依據本文所分析的作戰體系概念模型數據、仿真想定內容，對想定生成過程中涉及的數據節點進行整理。表 2 展示了數據含義與所在節點的對應關系。

　　基于已有的作戰體系仿真想定標準模板，在具體實現方法上，本文采用 C#語言作為開發語言，以 Visual Studio 2019 編譯器為基礎，歸納作戰體系仿真想定生成的實現流程如下：

　?、?依據仿真想定標準模板文件，調用 DOM 技術[13]進行對象節點構建;

　?、?按照模板文件具體格式規范，將匹配完成的武器裝備、作戰行為數據，整合讀取后未經匹配的其他類型作戰數據，插入指定的對象節點中;

　?、?重復步驟①至②，直至構建完成仿真想定中全部對象節點，至此形成仿真想定完整 DOM 樹;

　?、?通過對 Xml 庫的調用，將 DOM 樹進行逆向生成，得到.xml 格式規范的作戰體系仿真想定文件，導出至指定路徑;

　?、?將作戰體系仿真想定文件輸入已有的作戰仿真推演平臺，驗證想定生成結果是否可運行、符合設計結果。

　　4 仿真想定生成實例及驗證分析

　　為驗證映射流程，選擇編隊突襲防御體系，讀取其作戰體系概念模型進行驗證。

　　首先通過編寫好的 SWRL 規則庫，調用推理機，對知識庫中已有組合模型本體進行語義層面推理，得到任務本體組合關系、子任務先后次序關系的推理結果，如圖 5、6 所示。

　　將概念模型作為智能映射算法輸入，得到相似度計算結果如表 3 所示。

　　通過人工操作，將平臺推薦的高波級驅逐艦匹配目標 052C 改為基隆級驅逐艦。

　　對于待匹配作戰行為“空中目標攔截”，選擇知識庫中已有組合模型“空中目標攔截”作為匹配結果。對組合模型進行語義信息讀取，并對分解后的原子模型進行映射，如圖 7 所示。

　　至此，概念模型中的作戰活動數據“空中目標攔截”被分解為“編隊起飛-編隊探測目標-編隊巡邏 -編隊空戰-編隊返航”本體行為序列實現，并通過映射算法匹配至合適的仿真模型組合，實現了仿真平臺庫內模型的組合重用。

　　利用實驗室已有的作戰仿真推演平臺，對生成的仿真想定進行讀取，得到初始態勢界面如圖 8 所示，證明仿真想定文件實現成功讀取。進行仿真推演，作戰態勢符合情境，想定成功讀取運行。

　　5 結論

　　本文基于本體理論建立了作戰領域知識庫，基于自頂向下思想構建頂層本體，設計網絡爬蟲建立作戰行為同義詞庫，通過自動化添加方式對知識庫底層本體加以完善。編寫 SWRL 規則庫，將對象屬性中的語義信息推理得到本體層面的組合關系。設計智能映射算法，針對不同類型的待匹配數據，應用不同的映射算法，將本體關系映射至仿真模型的組合關系，實現模型的組合重用。最后，讀取編隊突防體系概念模型，經過語義匹配與組合推理，生成仿真想定，運用仿真推演平臺讀取想定，其運行結果符合情境，驗證了本文映射流程的有效性、生成仿真想定的有效性。

上一篇：織造企業實現智能化生產的可行性探討

下一篇：面向混合數據的代價敏感三支決策邊界域分類方法

相關論文推薦

論文指導 >

SCI期刊推薦 >

論文常見問題 >

SCI常見問題 >

国产视频www-国产视频xxx-国产视频xxxx-国产视频一二-一本大道香蕉中文日本不卡高清二区-一本久久精品一区二区

基于語義匹配與組合的模型重用技術研究