Python助力Tableau代码驱动分析,助力实现数据科学的扩展性
文章来自:优阅达大数据生态
Tableau 直观且易于使用的可视化操作界面,帮助数据分析师乃至是其他领域的人们都可以看到并理解他们的数据。当然,同样包括像数据科学家或统计学家这样老练的数据分析用户。
为什么特别突出这类人群呢?因为他们的工作流程与数据分析师的略有不同,他们严重依赖统计和机器学习算法,通常只能从 R、Python 或 Matlab 访问并分析数据。
为了与这些库进行交互,统计人员和数据科学家必须编写代码,对其模型参数进行实验,再将结果以可视化方式来呈现。
而数据科学家通常选择的工具是一些编程语言构建的编辑器环境,例如 RStudio 或 Jupyter,他们可以在这些程序中混合创建代码和可视化效果。
过去,数据科学家不愿采用 Tableau 的主要原因之一是缺乏对这种代码驱动型迭代开发方法的支持。但随着 Tableau Dashboard Extensions API 和 Analytics Extensions API 的不断更新,这种形势有了新的变化。
如今, Tableau 结合了可进行代码驱动的数据科学应用和易于使用的拖放式可视化界面,为数据科学家和统计学家群体提供了更好的选择。
Analytical Extension 提供了可在 Tableau 工作簿中使用 Python、R、Matlab 和其他平台的库和函数的标准方法。使用标准的 Tableau “ SCRIPT ”函数,用户可以将其 Python 或 R 代码添加为 Tableau 计算字段,从而开启更高级的分析体验。
尽管这仅仅结合了 Tableau 现有的计算功能,但与笔记本型机器的迭代体验并不相同。Dashboard Extensions API 可以为用户提供更多帮助,例如提供在 Tableau 代码编辑器中使用代码的体验,并同步以 Tableau 图表的可视化形式查看结果,分析效率更高效。
Tableau Extension Gallery 平台最近更新了一个扩展程序,该扩展允许用户与代码进行交互(就像在代码笔记本中那样)。在代码编辑器中更改代码时, Tableau 会执行这些命令并重新计算标记,且立即在当前窗口中更新可视化效果。
要使用扩展,首先需要创建一个字符串参数,再创建一个基于 SCRIPT 函数的计算字段,并将相关字段映射为脚本参数。
然后将扩展程序添加到仪表板中,选择先前创建好的参数,并将配置选择为与 Analytics Extension API 中相同的编程语言(例如是 R / Python):
图示:向仪表板添加并配置 CodePad 扩展程序
现在,你可以开始构建可视化视图,将其添加到机器学习模型中,并使用外部 API 来丰富数据的层次,这一切在 Tableau 中即可完成!最棒的体验在于,你可以重复使用同一工作簿,以与最终用户共享分析,该分析可以放置在不同的工作表上。
如何在实际业务分析中具体运用呢?Tableau 技术团队将示例工作簿与三种基于 Python 的算法放在了一起,以便我们更直观感受最终结果:
01
聚类分析
此仪表板使用 scikit Learn 的 DBSCAN 算法将聚类分析应用于一组点。
图示:使用 DBSCAN 算法的集群
02
季节性分析
使用 statsmodel 的 “seasonal_decompose” 从时间序列数据中删除季节性并显示纯趋势。
03
情感分析
比较产品评论的标题和等级,及其情感评分。
图示:使用 ntlk 或 textblob 进行情感分析
结 语:立即开始探索吧!
你是否已跃跃欲试?拷贝下方链接至浏览器打开,立即下载扩展程序和演示工作薄,开始更深入的探索吧!PS:需要提前在机器上安装好 Python,并已成功链接至 Tableau(通过 TabPy),方可正常打开和查看工作薄哦~
扩展程序下载地址:
https://extensiongallery.tableau.com/extensions/200
工作薄下载地址:
https://tableau-extension-gallery-backend-production.s3-us-west-2.amazonaws.com/products/200/CodePad+Demo.twbx
Python大数据分析
data creates value
扫码关注我们