模式識別--統計模式識別(1)

統計模式識別

1.統計模式識別基本概念

  • 特徵(Feature)

特徵是可以用來體現類別之間相互區別的某個或某些數學測度,測度的值稱爲特徵值

  • 樣本(Sample)

被分類或識別的模式個體稱爲樣本,特徵值必須由樣本的原始數據計算得到。

  • 特徵空間(Feature Space)

由所有特徵值爲變量軸所形成的歐氏空間。

  • 特徵向量(Feature Vector)

以所有特徵值爲其分量的向量。

  • 訓練和學習

訓練(Training)

對分類器或分類器設計提供一批類別已知的樣本(統計學概念),使之可以確定適當的待分類別、待分類別個數、分類決策規則,以及估算錯誤分類的概率,從而形成可以對未知樣本進行分類的分類器。這些類別已知的樣本稱爲訓練樣本,否則稱爲未知樣本待分類樣本(即識別對象)。

學習(Learning)

學習過程就是指訓練過程,但兩者的含義和出發點有所不同。訓練是被動的,學習是主動的。

2.統計模式識別系統設計

系統組成部分

統計模式識別系統組成部分一般包含:傳感器,數據預處理,特徵計算和分類器。我們用一個通用的模式識別系統舉例:


系統設計過程

統計模式識別系統設計一般包含這麼幾個步驟:收集樣本數據——>選擇特徵集——>選擇分類器——>訓練分類器——>評價分類器。用流程圖來表示:


學習過程(提供一批訓練樣本):特徵選擇與提取——>分類器設計;

分類過程(針對待分類的未知樣本):特徵形成與計算——>分類器決策 ;

  • 特徵的選擇與提取

特徵選擇:從原始特徵集中優選特徵組合;

特徵提取:由原始特徵集進行數學(正交)變換得到新特徵集

  • 特徵形成與計算
當識別對象是波形或圖像時,特徵可以由這些原始數據直接計算得到。當識別對象是實物或某種過程時,特徵也可以是由儀表或傳感器測量出來。

一個完整的統計模式識別系統設計流程大抵如此。