王茂霖:特征工程方法总结!

Datawhale

共 786字,需浏览 2分钟

 ·

2021-05-05 11:49

↑↑↑关注后"星标"Datawhale
每日干货 & 每月组队学习,不错过
 Datawhale干货 
作者:王茂霖,华中科技大学,Datawhale成员

内容概括

1.经典特征工程构造

2.特征工程案例实践


PPT完整下载:后台回复“210501”可获取

视频地址:https://www.bilibili.com/video/BV1sf4y1s7Fw


特征工程构造


特征工程是数据科学最有创造力的部分


一、特征的类型汇总


二、特征工程方法总


三、类别特征的常用编码方法

1.Label Encoder

2.One-Hot Encoder

3.Frequency 编码

4.Target 编码

5.其他编码


四、数值特征的常用编码方法


五、时间特征的常用编码方法

特征工程实践

1.特征构造

特征工程构建大概可以从三个方面入手:领域特征,交叉特征和多项式特征。


2.特征选择

特征选择可能会降低模型的预测能力。因为被剔除的特征中可能包含了有效的信息,抛弃了这部分信息会一定程度上降低预测准确率。

本文作者

王茂霖,Datawhale重要贡献成员,Datawhale&天池数据挖掘学习赛开源内容发起人,全网阅读超10w。


参赛30余次,获得DCIC-数字中国创新创业大赛亚军,全球城市计算AI挑战赛,Alibaba Cloud German AI Challenge等多项Top10。

分享地址

  • 复制链接打开(或阅读原文)
  • https://www.bilibili.com/video/BV1sf4y1s7Fw
整理不易,三连
浏览 6
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报