如何解读决策树和随机森林的内部工作机制?
日期:2020年10月17日
正文共:2918字14图
预计阅读时间:8分钟
来源:pivotal
Ando Saabas 的项目:https://github.com/andosa/treeinterpreter
创建图表的代码:https://github.com/gregtam/interpreting-decision-trees-and-random-forests
(7.587 - 9.958) + (5.701 - 7.587) = -4.257
(4.473 - 5.701) = -1.228
from treeinterpreter import treeinterpreter as ti dt_reg_pred, dt_reg_bias, dt_reg_contrib = ti.predict(dt_reg, X_test)
(0.59 - 0.315) = 0.275
(0.747 - 0.59) = 0.157
最小值等于 5
最大值等于 10
平均值为 8
下四分位数为 7,即第一四分位数(Q1),等于该样本中所有数值由小到大排列后第 25% 的值。
中位数为 8.5,即第二四分位数(Q2),等于该样本中所有数值由小到大排列后第 50% 的值。
上四分位数为 9,即第三四分位数(Q3),等于该样本中所有数值由小到大排列后第 75% 的值。
四分位距为 2(即ΔQ=Q3-Q1)。
上图白点代表中位数
灰色的矩形代表 Q3 和 Q1 之间的四分位距
灰线代表 95% 的置信区间
— THE END —
评论