用人話解釋機器學習中的Logistic Regression(邏輯迴歸)

轉載請註明出處:http://www.codelast.com/
Logistic Regression(或Logit Regression),即邏輯迴歸,簡記爲LR,是機器學習領域的一種極爲常用的算法/方法/模型。
你能從網上搜到十萬篇講述Logistic Regression的文章,也不多我這一篇,但是,就像我寫過的最優化系列文章一樣,我仍然試圖用「人話」來再解釋一遍——可能不專業,但是容易看得懂。那些一上來就是幾頁數學公式什麼的最討厭了,不是嗎?
所以這篇文章是寫給完全沒聽說過Logistic Regression的人看的,我相信看完這篇文章,你差不多可以從無到有,把邏輯迴歸應用到實踐中去。

Logistic Regression是一種分類算法。分類,也就是把一個羣體(或問題,或數據)分爲幾個類別,例如,男/女/人妖;愛她的人/不愛她的人;今天會下雨/今天不會下雨。
Logistic Regression最常用於處理「二分類」問題,也就是說分類只有兩個,像「愛她的人/不愛她的人」就是二分類,而「男/女/人妖」就不是二分類。當然,Logistic Regression也可以用於處理多分類問題,即所謂的「多分類邏輯迴歸」(Multiclass Logistic Regression),但本文並不涉及這個方面。
所以,說得簡單點就是,給你一條數據,用Logistic Regression可以判斷出這條數據應該被分到兩個類別中的哪個中去。

Logistic Regression在現實世界中非常有用。例如,可以用它來判斷一個用戶是否會點擊一個廣告(會點擊/不會點擊),可以用Logistic Regression來判斷兩類人是否會相愛(會相愛/不會相愛),等等。

機器學習的主旨就是通過對歷史數據的計算(即「學習」),得到一些未知參數的值,從而可以推斷出新數據會有什麼結論。例如一個非常簡單的函數: y=ax+b ,在已知幾組 (x,y) 歷史數據的情況下:
(1, 5.5)
(1.5, 7)
(2, 6.5)
這裏寫圖片描述

這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述
這裏寫圖片描述