【好书推荐】数据挖掘从基础到进阶

共 1754字,需浏览 4分钟

 ·

2021-02-02 10:12

↑↑↑点击上方蓝字,回复资料,10个G的惊喜


“数据是新时代的石油。”

——Clive Humby


在当今的人工智能时代,数据分析和挖掘似乎已经是一个很古老的话题。这也难怪,对数据的分析甚至可以追溯到中国第一经—《易经》这部远古文明的产物,至少17世纪就开始的数理统计学为数据分析准备了齐全的数学工具,而领域公认的第一个数据挖掘算法也早在27年前就发表了。

 

事实上,目前的人工智能的发展是由数据驱动的。从数据中挖掘得到的知识在很大程度上成就了人工智能的奇妙,比如机器翻译、人脸识别、对话机器人等。目前人工智能所面临的问题是推广,也就是需要在各行各业将人工智能的能力发挥出来。这个能力的发挥在很大程度上依赖于数据的使用能力。而数据使用的难度源于数据的复杂性和多样性,我们需要一系列处理数据的工具,也就是数据挖掘工具,它是人工智能、机器学习任务的一个重要部分。

 

在过去二十多年中,数据挖掘领域取得了很大的进步,从计算机科学的角度来看尤其明显。尽管传统的概率与统计领域对数据分析已经有了广泛和深入的研究,但数据挖掘这个术语是由计算机科学相关的社区所创立的。对计算机科学家来说,计算的可扩展性、可用性和计算的执行都是极为重要的。

 

本期老胡为大家推荐几本经典的数据挖掘图书。

 

《数据挖掘:原理与实践(基础篇)


作者[] 查鲁·C. 阿加沃尔

译者王晓阳、王建勇、禹晓辉、陈世敏

 

推荐理由:大数据和人工智能时代的数据挖掘教材和工具书。从四个“超级问题”出发,不仅详解数据挖掘的基础知识,而且还介绍高级数据类型,结合复杂多样的实际数据环境,探讨数据挖掘的应用场景和使用方法。

本书中文版分为基础篇和进阶篇。基础篇(包括原书的第1-13章)详细介绍了针对数据挖掘的四个主要问题(聚类、分类、关联模式挖掘和异常分析)的各种解决方法、用于文本数据领域的特定挖掘方法,以及对于数据流的挖掘应用。

 


 

《数据挖掘:原理与实践(进阶篇)》


作者[美] 查鲁·C. 阿加沃尔

译者王晓阳、王建勇、禹晓辉、陈世敏

 

推荐理由:大数据和人工智能时代的数据挖掘教材和工具书。从四个“超级问题”出发,不仅详解数据挖掘的基础知识,而且还介绍高级数据类型,结合复杂多样的实际数据环境,探讨数据挖掘的应用场景和使用方法。

进阶篇(包括原书的第14-20章)主要讨论了用于不同数据领域(例如时序数据、序列数据、空间数据、图数据)的特定挖掘方法,以及重要的数据挖掘应用(例如Web数据挖掘、排名、推荐、社交网络分析和隐私保护)。

 

 

《数据挖掘导论(原书第2版)》

   点击购买

作者[美]陈封能

迈克尔·斯坦巴赫

阿努吉·卡帕坦

维平·库玛尔

译者段磊 张天庆

推荐理由:陈封能领衔编写的数据挖掘经典畅销教材新版,斯坦福大学、密歇根州立大学、明尼苏达大学、得克萨斯大学等知名高校的数据挖掘课程教材。从基础概念和算法的角度介绍数据挖掘所使用的主要原理与技术。

 

 

《数据挖掘:概念与技术(原书第3版)》

作者(美)Jiawei Han

Micheline Kamber

Jian Pei 

译者范明、孟小峰

推荐理由:数据挖掘领域最具里程碑意义的经典著作,完整全面阐述该领域的重要知识和技术创新。引入了许多算法和实现示例,全部以易于理解的伪代码编写,适用于实际的大规模数据挖掘项目。讨论了一些高级主题,例如挖掘面向对象的关系型数据库、空间数据库、多媒体数据库、时间序列数据库、文本数据库、万维网以及其他领域的应用等。全面而实用地给出用于从海量数据中获取尽可能多信息的概念和技术。


也可以加一下老胡的微信
围观朋友圈~~~


推荐阅读

(点击标题可跳转阅读)

我爱线代,线代使我快乐

麻省理工学院计算机课程【中文版】

【清华大学王东老师】现代机器学习技术导论.pdf

机器学习中令你事半功倍的pipeline处理机制

机器学习避坑指南:训练集/测试集分布一致性检查

机器学习深度研究:特征选择中几个重要的统计学概念

老铁,三连支持一下,好吗?↓↓↓

浏览 43
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报