用人話解釋機器學習中的Logistic Regression（邏輯迴歸）

時間 2021-01-06 標籤 LR 深度學習通俗理解

轉載請註明出處：http://www.codelast.com/
Logistic Regression（或Logit Regression），即邏輯迴歸，簡記爲LR，是機器學習領域的一種極爲常用的算法／方法／模型。
你能從網上搜到十萬篇講述Logistic Regression的文章，也不多我這一篇，但是，就像我寫過的最優化系列文章一樣，我仍然試圖用「人話」來再解釋一遍——可能不專業，但是容易看得懂。那些一上來就是幾頁數學公式什麼的最討厭了，不是嗎？
所以這篇文章是寫給完全沒聽說過Logistic Regression的人看的，我相信看完這篇文章，你差不多可以從無到有，把邏輯迴歸應用到實踐中去。

Logistic Regression是一種分類算法。分類，也就是把一個羣體（或問題，或數據）分爲幾個類別，例如，男/女/人妖；愛她的人/不愛她的人；今天會下雨/今天不會下雨。
Logistic Regression最常用於處理「二分類」問題，也就是說分類只有兩個，像「愛她的人/不愛她的人」就是二分類，而「男/女/人妖」就不是二分類。當然，Logistic Regression也可以用於處理多分類問題，即所謂的「多分類邏輯迴歸」（Multiclass Logistic Regression），但本文並不涉及這個方面。
所以，說得簡單點就是，給你一條數據，用Logistic Regression可以判斷出這條數據應該被分到兩個類別中的哪個中去。

Logistic Regression在現實世界中非常有用。例如，可以用它來判斷一個用戶是否會點擊一個廣告（會點擊／不會點擊），可以用Logistic Regression來判斷兩類人是否會相愛（會相愛／不會相愛），等等。

機器學習的主旨就是通過對歷史數據的計算（即「學習」），得到一些未知參數的值，從而可以推斷出新數據會有什麼結論。例如一個非常簡單的函數： y=ax+b ，在已知幾組 (x,y) 歷史數據的情況下：
(1, 5.5)
(1.5, 7)
(2, 6.5)