模式識別

1.1 模式與模式識別

模式能夠看做是對象的組成成分或影響因素間存在的規律性關係,或者是因素間存在肯定性或隨機性規律的對象、過程或事件的集合。算法

模式識別就是對模式的區分和認識,把對象根據其特徵歸到若干類別中適當的一類。性能

模式識別是經過一系列數學方法讓機器(計算機)來實現相似人的模式識別能力。學習

樣本:所研究對象的一個個體。設計

樣本集:若干樣本的集合。對象

類或類別:在全部樣本上定義的一個子集,處於同一類的樣本在咱們所關心的某種性質上是不可區分的,即具備相同的模式。事件

特徵:指用於表徵樣本的觀測,一般是數值表示的某些量化特徵,有時也被稱爲屬性。若是存在多個特徵,則它們就組成了特徵向量。樣本的特徵構成了樣本的特徵空間,空間的維數就是特徵的個數,而每個樣本就是特徵空間的一個點。某些狀況下,對樣本的原始描述多是非數值形式的,此時一般須要採用必定的方法把這些特徵轉換成數值特徵。數學

已知樣本:指事先知道的類別標號的樣本。基礎

未知樣本:指類別標號未知但特徵已知的樣本。方法

所謂模式識別的問題就是用計算機的方法根據樣本的特徵將樣本劃分到必定的類別中去。數據

1.2 模式識別的主要方法

解決模式識別問題的方法能夠概括爲基於基礎知識的方法和基於數據的方法兩大類。

1.3 監督模式識別與非監督模式的識別

監督模式識別:在要解決的模式是別的問題中,咱們已知要劃分的類別,而且可以得到必定數量的類別已知的訓練樣本,這種狀況下創建分類器的問題屬於監督學習的問題。

無監督模式識別:根據樣本特徵將樣本聚成幾個類,使屬於同一個類的樣本在必定意義上是類似的,而不一樣類之間的樣本則由較大差別,這種學習過程稱爲非監督模式學習。

1.4  模式識別系統舉例

語音識別

說話人識別

字符與文字識別

複雜圖像中特定目標的識別

1.5 模式識別的系統的典型構成

一個模式識別系統一般包括原始數據的獲取和預處理、特徵提取與選擇,分類或聚類、後處理四個主要部分。

處理監督模式識別問題的通常步驟:

分析問題:深刻研究應用領域的問題,分析是否屬於模式識別問題,把所研究的目標表示爲必定的類別,分析給定數據或者能夠觀測的數據中哪些因素可能與分類有關。

原始特徵獲取:設計實驗,獲得已知樣本,對樣本實施觀測和預處理,獲取可能與樣本分類有關的觀測向量(原始特徵)

特徵提取與選擇:爲了更好地進行分類,可能須要採用必定的算法對特徵進行再次提取和選擇。

分類器設計:選擇必定的分類器方法,用已知樣本進行分類器訓練

分類決策:利用必定的算法對分類器性能進行分類,必要時根據領域知識進行進一步處理。

處理非監督模式識別問題的通常步驟:

分析問題:深刻研究應用領域的問題,分析研究目標可否經過尋找適當的聚類來達到;若是可能,猜想可能的或但願的類別數目;分析給定數據或者能夠觀測的數據中哪些因素可能與聚類有關。

原始特徵的獲取:設計實驗,獲得待分析的樣本,對樣本實施觀測和預處理,獲取可能與樣本聚類有關的觀測向量(原始特徵)

特徵提取與選擇:爲了更好地進行聚類,可能須要採用必定的算法對特徵進行再次提取和選擇。

聚類分析:選擇必定的非監督模式識別方法,用樣本進行聚類分析。

結果解釋:考察聚類結果的性能,分析所得聚類與研究目標之間的關係,根據領域知識分析結果的合理性,對聚類的含義給出解釋;若是有新樣本,把聚類結果用於新樣本分類。