在数据可视化这一块,我们可能真比不上几百年前的科学家

大数据文摘

共 1767字,需浏览 4分钟

 ·

2020-12-26 12:22

大数据文摘授权转载自Python专栏


只要是跟数据打交道,数据可视化绕不过去的一个最后步骤。


现在我们有很多工具来实现数据可视化,比如 Excel 、PowerPoint 、Tableau ,都可以根据你的数据自动生成各种图表,而且非常好看。


但是自动产生的图表就一定正确吗?或者说,是不是我们数据的最佳表现形式?


自动化貌似为我们省了不少事,但我们却逐渐忘了数据可视化的本质,在这一点上,我们真还得跟几百年前的科学家们好好学学


数据可视化不完全历史

数据可视化的历史远远比计算机的历史要长,也就是说,在科学家们最初试图用图形表现数据的时候,是没有任何辅助工具的,更别提可以自动生成的软件了。

早在公元前1160年,一份都灵纸莎草地图就准确地描绘了地质资源的分布,并提供了这些资源的开采信息,这可以说是历史上第一份数据可视化地图,也可以看做是数据可视化的开端


当然了,这可能太久远了,地理信息的可视化可以说是人类的一种本能,包括迈锡尼的 Linear b 碑文中描绘的关于青铜时代晚期地中海贸易的可视化信息,以及大名鼎鼎的托勒密地图,都属于最早期的数据可视化。


纸张和羊皮纸的发明使得数据可视化的发展到达了新的阶段,除了地图,其他形式的可视化也出现了,下图是一张10世纪的一个图表,描绘了行星的运动情况


看看,是不是有点内味了?

这个图表表示的是行星轨道的倾角随时间变化的曲线,为了达到这个目的,黄道带被表示在一个平面上,水平线被划分为三十个部分,作为时间或纵轴。垂直轴表示黄道带的宽度。

到了十七世纪,随着法国数学家笛卡尔皮埃尔·德·费马发明了解析几何二维坐标系,数值显示和计算方法产生了革命性的改变,这为现代数据可视化鼻祖 William Playfair 的工作打下了坚实的基础。

我们现在熟悉的折线图、条形图饼状图几乎都是他一手创建。

在他1786年出版的《商业与政治地图集》中,William Playfair 用34个条形图展现了1781年苏格兰对17个国家的进出口情况。


在这本《商业与政治地图集》中,William Playfair 还采用了面积图来表示丹麦和挪威从1700年到1780年的进出口情况。


1801年,William Playfair 在伦敦出版的《统计短语》中绘制了历史上第一张饼图,显示了1789年前土耳其人分布在亚洲、欧洲和非洲的比例。


我们应该学什么?

有了计算机之后,计算机先是承担了计算的任务,图形化界面的出现后,计算机又开始承担了可视化的任务。

既然有了更先进的技术,在进行数据可视化时,我们还需要从几百年前的科学家们学点什么?

其实我们最需要学习的,不是技巧,而是目的。

为什么这么说?这里先给大家举两个例子。

2014年在在《可负担医疗法案》进行激烈辩论期间,福克斯新闻播放了一个画面,这是一个柱状图,表明ACA对医疗保健的需求低于预期。


没仔细看的人,可能也会认为,3月27才600万,离3月31日706万的目标差的很远啊。

但是仔细看一下我们就会发现,按比例来看,纵轴并不是从0开始的,而是大概从525万开始,如果我们从0开始绘制,图像应该是这样。


看见没有?差的不是很多,奥巴马其实已经完成了85%,还有4天去实现剩下的15%。

另一个是路透社于 2014 年发布的佛罗里达州枪击犯罪的统计。很明显,这张图的作者把Y轴翻转,通过这样的方式,成功让许多读者误认为 ‘Stand Your Ground’ 法律让枪击案下降了。


然而事实恰恰相反,真实的图应该是这样的。


看完这两个例子,相信大家应该懂了,数据可视化是一种让数据更直观的手段,但是我们首先要秉承的,是遵从客观数据

在进行数据可视化时,我们必须首先考虑我们真正想描述的东西,就像 William Playfair 所做的一样,我们先必须考虑收集数据的过程以及数字如何彼此关联,而不是通过各种技巧误导读者

用一句熟悉的话来说,就是“不忘初心”。

在这方面,我们是得跟几百年前的科学家好好学学。



点「在看」的人都变好看了哦!
浏览 15
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报