第 17 章 比例墨水原则 墨水比例原则
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
在许多不同的可视化场景中,我们都会用图形元素的范围来表示数据值。 例如,在条形图中,我们绘制的条形图以 0 为起点,以其所代表的数据值为终点。在这种情况下,数据值不仅包含在条形图的端点中,还包含在条形图的高度或长度中。如果我们绘制的条形图的起始值与 0 不同,那么条形图的长度和条形图的端点就会传达出相互矛盾的信息。这样的图形在内部是不一致的,因为它们用相同的图形元素显示了两个不同的值。与此形成对比的是,我们用一个点来显示数据值。在这种情况下,值只编码在点的位置上,而不编码在点的大小或形状上。
每当我们使用条形图、矩形图、任意形状的阴影区域等图形元素,或任何其他具有确定视觉范围的元素时,都会出现类似的问题,这些视觉范围可能与显示的数据值一致,也可能不一致。 在所有这些情况下,我们都需要确保不会出现不一致的情况。这一概念被称为墨水比例原则 [Bergstrom and West 2016]:
当使用阴影区域表示数值时,阴影区域的面积应与相应数值成正比。
(通常使用 "墨水 "一词来指可视化中任何偏离背景颜色的部分。 这包括线条、点、共享区域和文本。但在本章中,我们主要讨论的是阴影区域)。违反这一原则的现象非常普遍,尤其是在大众媒体和金融界。
线性轴可视化
我们首先考虑最常见的情况,即按照线性比例将金额可视化。图 17-1显示了夏威夷州五个县的收入中位数。 这是报纸文章中可能会出现的典型数字。 一眼望去,夏威夷州非常贫穷,而檀香山县则比其他县富裕得多。然而,图 17-1有很大的误导性,因为所有的柱形图都是从 50,000 美元的收入中位数开始的。因此,虽然每个条形图的端点正确地代表了各县的实际收入中位数,但条形图的高度却代表了收入中位数超过 50,000 美元的程度,这是一个任意的数字。而人类的感知是这样的,即当我们观察此图时,柱形高度才是我们感知到的关键数量,而不是柱形端点相对于y轴的位置。
图 17-1. 夏威夷州五个县的收入中位数。该图具有误导性,因为Y 轴刻度的起点是 50,000 美元,而不是 0 美元。因此,柱形高度与显示的数值不成正比,夏威夷州与其他四个县之间的收入差距看起来比实际差距大得多。数据来源:2015 五年美国社区调查。
对该数据集进行适当的可视化处理后,情况就不那么令人兴奋了(图 17-2)。虽然各县之间的收入中位数存在差异,但差异远没有图 17-1所示的那么大。总体而言,各县的收入中位数具有一定的可比性。
图 17-2. 夏威夷州五个县的收入中位数。此处的Y 轴刻度以 0 美元为起点,因此准确地显示了五个县收入中位数的相对大小。数据来源:2015 五年期美国社区调查。
备注
线性刻度上的柱形应始终从 0 开始。
类似的可视化问题经常出现在时间序列的可视化中, ,如股票价格的可视化。图 17-3显示,2016 年 11 月 1 日前后,Facebook 的股价出现了大规模崩盘。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access