《面向机器学习的特征工程》.pdf
机器学习与生成对抗网络
共 1405字,需浏览 3分钟
·
2021-11-09 10:16
前段时间发现apachecn在github上翻译了一本和特征工程相关的书籍:《Feature Engineering for Machine Learning》,中文名为《面向机器学习的特征工程》。
这本书包含了特征工程中的数字处理技巧、文本数据处理方式、特征缩放、类别特征、降维、非线性特征提取、自动化特征提取等方面,非常适合初学者。
书籍简介
特征工程对于应用机器学习来说是基础的,但是使用域知识来加强你的预测模型既困难成本又高。为了弥补特征工程现有资料的不足,本书将会为初中级数据科学家讲解如何处理这项广泛应用却鲜见讨论的技术。
- 数值型数据的特征工程:过滤、分箱、缩放、对数变换和指数变换
- 自然文本技术:词袋、n元词与短语检测
- 基于频率的过滤和特征缩放
- 分类变量编码技术:特征散列化与分箱计数
- 使用主成分分析的基于模型的特征工程
- 模型堆叠与k-均值特征化
- 图像特征提取:人工提取与深度学习
目录
第 1 章从数字数据的基本特征工程开始:过滤,合并,缩放,日志转换和能量转换以及交互功能。
中文版HTML
中文版的HTML格式如下,左侧为目录,右侧为具体内容,可以点击左侧目录跳转到对应的正文内容,非常方便。
获取方式
为了方便大家,附上书籍云盘下载链接。
点击下方👇名片关注:机器学习算法那些事 ,后台回复 1101(建议复制)即可获得百度网盘地址。
注意⚠️:是在上方👆公众号后台消息框中回复 1101,而非本号!
评论