模式識別--統計模式識別（1）

時間 2021-01-12 標籤 pattern recognition

統計模式識別

特徵是可以用來體現類別之間相互區別的某個或某些數學測度，測度的值稱爲特徵值。

被分類或識別的模式個體稱爲樣本，特徵值必須由樣本的原始數據計算得到。

由所有特徵值爲變量軸所形成的歐氏空間。

以所有特徵值爲其分量的向量。

對分類器或分類器設計提供一批類別已知的樣本（統計學概念），使之可以確定適當的待分類別、待分類別個數、分類決策規則，以及估算錯誤分類的概率，從而形成可以對未知樣本進行分類的分類器。這些類別已知的樣本稱爲訓練樣本，否則稱爲未知樣本或待分類樣本（即識別對象）。

學習過程就是指訓練過程，但兩者的含義和出發點有所不同。訓練是被動的，學習是主動的。

統計模式識別系統組成部分一般包含：傳感器，數據預處理，特徵計算和分類器。我們用一個通用的模式識別系統舉例：

統計模式識別系統設計一般包含這麼幾個步驟：收集樣本數據——>選擇特徵集——>選擇分類器——>訓練分類器——>評價分類器。用流程圖來表示：

學習過程（提供一批訓練樣本）：特徵選擇與提取——>分類器設計；

分類過程（針對待分類的未知樣本）：特徵形成與計算——>分類器決策 ;

特徵選擇：從原始特徵集中優選特徵組合；

特徵提取：由原始特徵集進行數學（正交）變換得到新特徵集

當識別對象是波形或圖像時，特徵可以由這些原始數據直接計算得到。當識別對象是實物或某種過程時，特徵也可以是由儀表或傳感器測量出來。

一個完整的統計模式識別系統設計流程大抵如此。