CART樹剪枝
預剪枝
後剪枝
總體思路:
具體過程:
原來的損失函數,子樹的整體損失等於,對於每個葉子節點t,葉子結點t的樣本個數再乘以葉子結點t的熵,的加和。
在此基礎上,加上正則項,損失函數可轉化爲:
lTleafl爲子樹的葉子結點的個數,Cα(T)是參數是α時的子樹T的整體損失。參數α權衡訓練數據的 擬合程度與模型的複雜度。設定了α就相當於給樹剪枝了,保證了不會隨着葉結點的增多,讓模型複雜。
在真實計算過程中,當α = 0時,相當於不加正則項,也就是相當於未剪枝,也就是表示未剪枝的決策樹損失最小;當α = 正無窮時,充分剪枝,造成單根結點的決策樹損失最小。
假定當前對以r爲根的子樹剪枝,可以計算剪枝前和剪枝後的損失函數,令兩者相等,可以恰巧求出一個α,讓剪枝前剪枝後損失相似,此時的α即爲剪枝係數。
表示了剪枝後整體損失函數減少的程度。