在数据可视化这一块，我们可能真比不上几百年前的科学家-技术圈

大数据文摘授权转载自Python专栏

只要是跟数据打交道，数据可视化绕不过去的一个最后步骤。

现在我们有很多工具来实现数据可视化，比如 Excel 、PowerPoint 、Tableau ，都可以根据你的数据自动生成各种图表，而且非常好看。

但是自动产生的图表就一定正确吗？或者说，是不是我们数据的最佳表现形式？

自动化貌似为我们省了不少事，但我们却逐渐忘了数据可视化的本质，在这一点上，我们真还得跟几百年前的科学家们好好学学。

数据可视化不完全历史

数据可视化的历史远远比计算机的历史要长，也就是说，在科学家们最初试图用图形表现数据的时候，是没有任何辅助工具的，更别提可以自动生成的软件了。

早在公元前1160年，一份都灵纸莎草地图就准确地描绘了地质资源的分布，并提供了这些资源的开采信息，这可以说是历史上第一份数据可视化地图，也可以看做是数据可视化的开端。

当然了，这可能太久远了，地理信息的可视化可以说是人类的一种本能，包括迈锡尼的 Linear b 碑文中描绘的关于青铜时代晚期地中海贸易的可视化信息，以及大名鼎鼎的托勒密地图，都属于最早期的数据可视化。

纸张和羊皮纸的发明使得数据可视化的发展到达了新的阶段，除了地图，其他形式的可视化也出现了，下图是一张10世纪的一个图表，描绘了行星的运动情况。

看看，是不是有点内味了？

这个图表表示的是行星轨道的倾角随时间变化的曲线，为了达到这个目的，黄道带被表示在一个平面上，水平线被划分为三十个部分，作为时间或纵轴。垂直轴表示黄道带的宽度。

到了十七世纪，随着法国数学家笛卡尔和皮埃尔·德·费马发明了解析几何和二维坐标系，数值显示和计算方法产生了革命性的改变，这为现代数据可视化鼻祖 William Playfair 的工作打下了坚实的基础。

我们现在熟悉的折线图、条形图和饼状图几乎都是他一手创建。

在他1786年出版的《商业与政治地图集》中，William Playfair 用34个条形图展现了1781年苏格兰对17个国家的进出口情况。

在这本《商业与政治地图集》中，William Playfair 还采用了面积图来表示丹麦和挪威从1700年到1780年的进出口情况。

1801年，William Playfair 在伦敦出版的《统计短语》中绘制了历史上第一张饼图，显示了1789年前土耳其人分布在亚洲、欧洲和非洲的比例。

我们应该学什么？

有了计算机之后，计算机先是承担了计算的任务，图形化界面的出现后，计算机又开始承担了可视化的任务。

既然有了更先进的技术，在进行数据可视化时，我们还需要从几百年前的科学家们学点什么？

其实我们最需要学习的，不是技巧，而是目的。

为什么这么说？这里先给大家举两个例子。

2014年在在《可负担医疗法案》进行激烈辩论期间，福克斯新闻播放了一个画面，这是一个柱状图，表明ACA对医疗保健的需求低于预期。

没仔细看的人，可能也会认为，3月27才600万，离3月31日706万的目标差的很远啊。

但是仔细看一下我们就会发现，按比例来看，纵轴并不是从0开始的，而是大概从525万开始，如果我们从0开始绘制，图像应该是这样。

看见没有？差的不是很多，奥巴马其实已经完成了85%，还有4天去实现剩下的15%。

另一个是路透社于 2014 年发布的佛罗里达州枪击犯罪的统计。很明显，这张图的作者把Y轴翻转了，通过这样的方式，成功让许多读者误认为 ‘Stand Your Ground’ 法律让枪击案下降了。

然而事实恰恰相反，真实的图应该是这样的。

看完这两个例子，相信大家应该懂了，数据可视化是一种让数据更直观的手段，但是我们首先要秉承的，是遵从客观数据。

在进行数据可视化时，我们必须首先考虑我们真正想描述的东西，就像 William Playfair 所做的一样，我们先必须考虑收集数据的过程以及数字如何彼此关联，而不是通过各种技巧误导读者。

用一句熟悉的话来说，就是“不忘初心”。

在这方面，我们是得跟几百年前的科学家好好学学。

点「在看」的人都变好看了哦！