CART樹的剪枝

時間 2021-01-13 標籤機器學習決策樹過擬合決策樹剪枝 CART

CART樹剪枝

預剪枝

後剪枝

總體思路：

具體過程：

原來的損失函數，子樹的整體損失等於，對於每個葉子節點t，葉子結點t的樣本個數再乘以葉子結點t的熵，的加和。

在此基礎上，加上正則項，損失函數可轉化爲：

lTleafl爲子樹的葉子結點的個數，Cα(T)是參數是α時的子樹T的整體損失。參數α權衡訓練數據的擬合程度與模型的複雜度。設定了α就相當於給樹剪枝了，保證了不會隨着葉結點的增多，讓模型複雜。

在真實計算過程中，當α = 0時，相當於不加正則項，也就是相當於未剪枝，也就是表示未剪枝的決策樹損失最小；當α = 正無窮時，充分剪枝，造成單根結點的決策樹損失最小。

假定當前對以r爲根的子樹剪枝，可以計算剪枝前和剪枝後的損失函數，令兩者相等，可以恰巧求出一個α，讓剪枝前剪枝後損失相似，此時的α即爲剪枝係數。

表示了剪枝後整體損失函數減少的程度。