【开放书】《命令行数据科学指南(第二版)》
来源:专知 本文附论文,建议阅读5分钟
这篇经过彻底修改的指南演示了命令行的灵活性如何帮助您成为更高效和高效的数据科学家。
从网站、API、数据库和电子表格中获取数据 对文本、CSV、HTML、XML和JSON文件执行擦洗操作 研究数据,计算描述性统计数据,并创建可视化 管理您的数据科学工作流 从一行程序和现有的Python或R代码创建您自己的工具 并行和分发数据密集型管道 用降维、回归和分类算法建模数据 利用Python、Jupyter、R、RStudio和Apache Spark中的命令行
评论