智能電網(輸變電部分)領域知識體系構建和語義研究與應用
如今,隨著電力技術的發展日新月異,用戶對電能質量的要求也逐漸提高,多個國家陸續提出了各自關于智能電網建設的方案。國家電網公司作為國有特大型央企,提出了建設堅強智能電網,以實現電網中電力流、業務流、
7、知識庫檢索系統
本文研究基于領域知識的語義標引技術,通過對本體工具、數據加工模型的圖書文獻檢索等技術的研究,完成了以語義檢索應用為目的的智能電網(輸變電部分)專業知識庫系統研究。系統除處理常規的文本檢索之外,還提供了本體的交互式圖形可視系統、自然語言及問句式查詢系統、語義增強搜索系統以及相關詞條推薦系統,智能化地協助用戶提高檢索效率 ,主要支持的查詢功能如下。
7.1拼音提示
用Jena 將本體中的中文信息全部導出成為詞典,對詞條的拼音進行關鍵詞查詢和操作。以“變壓器”為例:
1 )在輸入框輸入或粘貼拼音,則輸出為全拼按從左到右的順序與輸入的拼音相同的一組提示詞,如輸入“biany”時,提示包括“變壓器”在內的10個詞;
2 )在輸入框輸入或粘貼拼音首字母,則輸出為拼音首字母按從左到右的順序與輸入相同的一組提示詞,如輸入“byq”時,提示包括“變壓器”在內的10 個詞;
3 )在輸入框輸入或粘貼漢字,則輸出根據該漢字的全拼給出同音詞的輸入提示,如輸入“邊壓氣”時,提示包括“變壓器”在內的10個詞。
7.2普通搜索
普通搜索界面如圖5 所示。
以“變電站”為例,在輸入框中輸入搜索詞條,如變電站,則輸出如下:
1 )在“您是不是想搜”條目下顯示的9個詞條,采用Lucene的Standard Analyzer對詞典進行處理,根據中文字形匹配程度得到結果;
2 )書籍的總搜索結果數和用時,通過數學統計計算得到;
3 )前 10 本書的標題、與搜索詞條匹配的摘要(摘要中搜索詞用紅色標出)、相關度,使用Lucene對文本進行全文檢索計算得到;
4 )頁碼選項,單擊頁碼之后跳轉到該頁碼,使用Lucene進行分頁查詢;
5 )如果是本體中的詞條,則出現本體交互圖,單擊可跳轉到交互界面,交互界面的查詢部分采用Jena預先加載本體,以加快與用戶交互的速度;
6 )如果有同級本體,則出現同級本體,單擊可跳轉到該詞條的搜索界面,同級本體通過Jena查詢得到;
7 )如果有相關本體,則出現相關本體,單擊可跳轉到該詞條的搜索界面,事先由Jena查詢得出本體中各個類和實例的描述信息及其屬性,存為文本,對這些文本用Lucene 建立索引,之后采用Lucene根據查詢語句進行查詢,當與查詢語句匹配度達到閾值之后,則返回相關本體;
8 )出現更多詞條等相關內容,單擊可跳轉到該詞條的搜索界面,更多詞條的信息來 自于使用Google word2vec對793 本圖書進行詞向量訓練得到的詞向量和詞語的聚類,首先找出查詢詞語中與聚類中詞語最相近的一個,之后返回這個聚類中的其他詞語。
7.3根據英文搜索中文結果
通過英文查詢中文的功能是通過Lucene對英文和中文建立一一對應的索引,這樣根據索引中英文的匹配程度,可以找到相應的中文。以“keysub station ”為例,根據英文搜索中文結果的界面如圖6 所示。
7.4語義增強搜索
語義增強搜索采用Jena 查詢出所查詞語的子類,再根據這些子類的名稱在793 本圖書中搜索,并將這些結果根據相關度由高到低排序,得出所需結果與子類匹配出的摘要 。如搜“建筑物”時,得到的是與其子類“防火墻”、“換流站”等匹配的文本,其他部分內容與普通查詢時相同。
7.5自然語言查詢
在輸入框中以自然語言的形式輸入,如果有對應的詞條,則輸出相應的詞條和解釋。以“變電站”為例,輸入“變換電壓等級匯集配送電能的設施是什么”時可以輸出結果“變電站”;輸入“在河流上下游的水電站”,則輸出“梯級水電站”;輸入“埋在地下的管子”,輸出“電纜排管”。自然語言查詢結果界面如圖7 所示。
7.6本體圖形交互
本體的圖形交互功能均通過Jena 預先加載本體,在查詢時對本體的各項信息進行查詢。
1 )單擊本體交互界面,界面放大,如果詞條有英文或釋義,則顯示當前詞條的詳細信息。在圖形中,父類與子類以不同的形式展示,變電站本體交互界面如圖8 所示,其中“建筑物”為父類,其他為子類。
2 )單擊某個詞條并進行拖動,顯示鼠標實時拖動效果。
3 )雙擊當前詞條(如當前的“變電站”),則顯示/隱藏該詞條的屬性。其中包括Object型的“線阻濾波器”和Data 型的“進線電壓 :string ”(string表示Data的類型)。顯示/ 隱藏變電站屬性界面如圖9所示。
4 )雙擊除當前詞條外的其他詞條,則以雙擊的詞條進行查詢,并顯示新的結果。雙擊建筑物顯示的界面如圖10 所示。
7.7書籍顯示
1 )在搜索結果頁面,單擊某本想看的書,則跳轉到書籍顯示界面,默認顯示pdf 文件,可通過右側滑動條翻頁,并顯示其相關文檔。書籍顯示界面如圖11 所示。
2 )點擊txt 標簽,則跳轉到txt 顯示界面,顯示該書籍對應的文本,可閱讀書籍文本,與本體相關的標注(包括中英文)用藍色和下劃線表示,單擊這些標注,如“變電站”、“sub station ”均可查看對應的“變電站”本體。中英文標注示例如圖12 、圖13 所示。
8、結語
通過本文智能電網領域(輸變電部分)專業知識概念體系的建立,完成了對一個典型的專業知識概念體系完整的建立過程的調研,以及初步的專業知識庫原型系統搭建。傳統以單本或單冊圖書為載體,一般按單一分類介紹的電力知識,很難形成體系,且概念之間的關系無法展示,相比之下智能電網領域(輸變電部分)專業知識概念體系解決了知識點分類單一且孤立的難題,方便使用者在相關領域輕松獲取所需知識概念及相關知識。在未來工作中,以下方面還有待進一步深入提高:
1 )在研究上,還需研究如何更好地進行本體的可視化,如何利用聚類、分類算法消除語義標注的歧義,如何自動對未知的屬性進行屬性發現,如何進語義推理得到更多屬性以及加快語義搜索速度;
2 )在工程上,可以在txt閱讀模式下提供圖片支持、完善作者信息、增加作者搜索、出版年份搜索、按標題搜索等功能,進一步實現根據詞頻、查詢頻繁度等更多信息進行拼音推薦等。
原標題:智能電網(輸變電部分)領域知識體系構建和語義研究與應用

責任編輯:lixin
免責聲明:本文僅代表作者個人觀點,與本站無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
我要收藏
個贊
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市