【翻译】| Excel,Python,和数据科学的未来
共 2046字,需浏览 5分钟
·
2021-06-25 20:38
本文翻译自Excel, Python, and the future of data science
By Matt Asay
如果无处不在的电子表格程序是通向数据科学的门户,那么 Python 的目标是成为下一个阶段。
数据科学世界充斥着开源:PyTorch、TensorFlow、Python、R 等等。但是数据科学中使用最广泛的工具不是开源的,通常甚至根本不被认为是数据科学工具。
它是 Excel,它在您的笔记本电脑上运行。
@
前言
关于建设者
重新组合未来
前言
Excel 是“智人历史上最成功的编程系统,”Anaconda 首席执行官 Peter Wang 在接受采访时说,“因为普通的‘麻瓜’可以使用这个工具……把他们的数据放进去……问他们的问题……和模块化事物。” 简而言之,使用 Excel 很容易提高工作效率。
卓越的易用性和生产力:这是Wang对流行的 Python 编程语言的未来设想。尽管Excel在没有开源的情况下取得了成功,但Wang认为Python的成功正是因为开源。
关于建设者
多年来,我们一直将软件视为某些公司向您收费的产品。至少在企业界,这从未反映现实。为什么?因为再好的产品,也永远不能完全满足客户的需求。除了客户为软件支付的费用外,他们还将为集成、定制等支付额外费用。简而言之,软件始终是一个过程,而不是真正的产品。
开源很早就发现了这一事实。Wang 说:“开源的作用是打开大门。这就像修补的权利,修理的权利,延长的权利。” 换句话说,开源包含软件即服务(即流程)的理念。
更重要的是,这意味着开源鼓励更多的人参与到它的创造和成功中。对于大多数软件,Wang 估计有 90% 到 95% 的用户被排除在创建过程之外。他们可能会看到演示,但他们相信其他人会代表他们提供软件价值。相比之下,“数据科学的开源之所以如此成功,是因为全新的用户类别变成了创造者和建设者,”Wang说。
需要明确的是,大多数人不是在编写 Python 脚本。但是 Python 让普通人更容易从事数据科学,这是它在数据科学领域取得成功的最大原因之一。对 Wang 而言,Python 的目标不是击败 Ruby、Perl 或其他一些编程语言,而是取代 Excel 作为普通主流用户首选的数据科学工具。“我正在推动 Python 和 PyData 成为 Excel 的概念继承者,”他说。
重新组合未来
我们怎么去那里?Wang 认为,开源社区是必不可少的,而不仅仅是那些能够提交代码的社区。他说,Python 拥有“混合文化、学习文化和教学文化”。
当然,代码在 Python 领域很重要。Wang 建议,这些提交者为其他人在此基础上构建的大部分内容奠定了基础:“通过维护特定的用户层和面向用户的 API 并为此提供一些稳定性,他们允许出现更高水平的贡献,并且茁壮成长。” 然而,这还不够。
这也不是唯一有价值的贡献。他指出,“所有在 Stack Overflow 上回答使用问题的人,以及所有撰写关于他们的第一个 Scikit-learn 模型的博客文章的人”,他们自己从事任何类型的数据分析工作可能只有两三年时间,但他们为其他人的参与铺平道路。
这是否比由一家公司推动特定产品的 Excel 创新模型更好?对于王来说,答案是肯定的。“当我们放慢速度并与其他人一起工作时,通常最终结果会比我们蹲下来做自己的事情要好,”他说。Wang希望,最终结果是社区开发的“Excel”将永远改变数据科学,使其比 Excel 更易于理解和广泛适用。
如果你有任何疑问,也可以通过公众号里我的联系方式加我好友,我将尽自己所能为你答疑。
猜你喜欢