科普:模式識別基本概念
模式識別研究的目的是利用計算機對物理對象進行分類,在錯誤概率最小的條件下,使識別的結果盡量與客觀物體相符合。機器辨別事物最基本的方法是計算,原則上是對計算機要分析的事物與標準模板的相似程度進行計算。因此首先要從度量中看出不同事物之間的差異,才能分辨當前要識別的事物。
1、模式的描述方法
在模式識別技術中,被觀測的每個對象成為樣品。對于每個樣品來說,必須確定一些與識別有關的因素,作為研究的根據,每一個因素成為一個特征。模式就是樣品所具有的特征的描述。模式的特征集又可用于同一個特征空間的特征向量表示。特征向量的每個元素稱為特征,該向量也因此稱為特征向量。
如果一個樣品X有n個特征,則可以把X看做一個n維列向量,該向量X稱為特征向量。模式識別問題就是根據X的n個特征來判別模式X屬于w1,w2,…wM類中的哪一類。待識別的不同模式都在同一特征空間中考察,不同模式類由于性質上的不同,它們在各自特征取值范圍內有所不同,因而會在特征空間的不同區域出現。
因此,模式識別系統的目標是在特征空間和解釋空間之間找到一種映射關系。特征空間是由 從模式得到的對分類有用的度量、屬性或基元 構成的空間,解釋空間是由 M個所屬類別的集合 構成。
2、模式識別系統
一個典型的模式識別系統如圖所示,由數據獲取、預處理、特征提取、分類決策及分類器設計五部分組成。一般分為上下兩部分:上部分完成未知類別模式的分類;下半部分屬于分類器設計的訓練過程,利用樣品進行訓練,確定分類器的具體參數,完成分類器的設計。而分類決策在識別過程起作用,對待識別的樣品進行分類決策。
1)特征提取和選擇
對原始數據進行變換,得到最能反映分類本質的特征。將維數較高的測量空間(原始數據組成的空間)轉變為維數較低的特征空間(分類識別賴以進行的空間)。
2)分類決策
在特征空間中用模式識別方法把被識別對象歸為某一類別。
3)分類器設計
基本做法是在樣品訓練集基礎上確定判別函數,改進判別函數和誤差檢驗。
3、統計模式識別研究的主要問題
1)特征的選擇與優化
對特征空間進行優化有兩種基本方法。一種是特征選擇,如果所選用的特征空間能使同類物體分布具有緊致性,可以為分類器設計提供良好的基礎;反之,如果不同類別的樣品在該特征空間中混雜在一起,再好的設計方法也無法提高分類器的準確性。另一種是特征的組合優化,通過一種映射變換改造原特征空間,構造一個新的精簡的特征空間。
2)分類判別
已知若干個樣品的類別以及特征,例如,手寫阿拉伯數字的判別是10個類的分類問題,機器首先要知道每個手寫數字的形狀特征,對同一個數字,不同的人有不同的寫法,必須讓機器知道它屬于哪一類。因此對分類問題需要建立樣品庫。根據這些樣品庫建立判別分類函數,這一過程由機器來實現,成為學習過程,然后對一個未知的新對象分析它的特征,決定它屬于哪一類。這是一種監督學習的方法。
3)聚類判別
移植若干對象和它們的特征,但不知道每個對象屬于哪一類,而且事先并不知道究竟分成多少類,用某種相似性度量的方法,及”物以類聚,人以群分”,把特征相同的歸為一類。這是一種非監督學習的方法。
責任編輯:售電衡衡
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網
-
新基建助推 數據中心建設將迎爆發期
2020-06-16數據中心,能源互聯網,電力新基建 -
泛在電力物聯網建設下看電網企業數據變現之路
2019-11-12泛在電力物聯網 -
泛在電力物聯網建設典型實踐案例
2019-10-15泛在電力物聯網案例
-
權威發布 | 新能源汽車產業頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業,設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業發展
-
探索 | 既耗能又可供能的數據中心 打造融合型綜合能源系統
2020-06-16綜合能源服務,新能源消納,能源互聯網 -
5G新基建助力智能電網發展
2020-06-125G,智能電網,配電網 -
從智能電網到智能城市