決策樹剪枝策略

在這裏插入圖片描述
更常用的是預剪枝:
限制深度:限制樹的高度。
限制葉子節點個數。
葉子節點樣本數:每個葉子節點裏面的樣本數。
信息增益:設置信息增益閾值。

後剪枝:C(T)=熵值*葉子節點裏面的樣本數, T l e a f |T_{leaf}| 剪枝候選人下面的葉子個數。