机器学习:不要低估树模型的威力
↑↑↑点击上方蓝字,回复资料,10个G的惊喜
选自towardsdatascience
树模型和神经网络,像一枚硬币的两面。在某些情况下,树模型的性能甚至优于神经网络。
基于树的方法通过垂直线和水平线逐段解决问题,以最小化熵(优化器和损失)。神经网络通过激活函数来逐段解决问题。
基于树的方法是确定性的,而不是概率性的。这带来了一些不错的简化,如自动特征选择。
决策树中被激活的条件节点类似于神经网络中被激活的神经元(信息流)。
神经网络通过拟合参数对输入进行变换,间接指导后续神经元的激活。决策树则显式地拟合参数来指导信息流。(这是确定性与概率性相对应的结果。)
我以前在这个平台上有过愉快的购物经历吗?如果有,继续。
我现在需要这件商品吗?(例如,冬天我应该买太阳镜和泳裤吗?)如果是,继续。
根据我的用户统计信息,这是我有兴趣购买的产品吗?如果是,继续。
这个东西太贵吗?如果没有,继续。
其他顾客对这个产品的评价是否足够高,让我可以放心地购买它?如果是,继续。
最好将基于树的方法视为神经网络的缩小版本,以更简单的方式进行特征分类、优化、信息流传递等。
基于树的方法和神经网络方法在用途的主要区别在于确定性(0/1)与概率性数据结构。使用确定性模型可以更好地对结构化(表格)数据进行建模。
不要低估树方法的威力。
↓↓↓我的朋友圈更精彩↓
推荐阅读
(点击标题可跳转阅读)
老铁,三连支持一下,好吗?↓↓↓
评论