第 4 章 色阶
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
在数据可视化中,颜色有三种基本用途:我们可以用颜色来区分数据组、表示数据值和突出显示。 在这三种情况下,我们使用的颜色类型和使用方式是完全不同的。
颜色是区分的工具
我们经常用颜色来区分没有内在顺序的离散项目或群体,例如地图上的不同国家或某种产品的不同制造商。在这种情况下,我们使用定性色标。 这种色标包含一组有限的特定颜色,这些颜色既要相互区别,又要相互等同。第二个条件要求,相对于其他颜色,任何一种颜色都不能突出。此外,这些颜色也不应给人一种有序的印象,就像一连串颜色依次变浅一样。这样的颜色会在被上色的物品中产生明显的顺序,而根据定义,这些物品是没有顺序的。
许多合适的定性色标都是现成的。图 4-1展示了三个具有代表性的例子。其中,ColorBrewer 项目提供了一个不错的定性颜色标度选择,包括相当浅和相当深的颜色[Brewer 2017]。
图 4-1. 定性颜色标度示例。Okabe Ito 量表是本书中使用的默认量表[Okabe and Ito 2008]。ColorBrewer Dark2 比例由 ColorBrewer 项目提供[Brewer 2017]。ggplot2 色调标度是广泛使用的绘图软件 ggplot2 中的默认定性标度。
以图 4-2 为例,说明我们如何使用定性色标。图中显示了 2000 年至 2010 年美国各州的人口增长百分比。 我将各州按人口增长顺序排列,并按地理区域着色。这种着色强调了同一地区的各州经历了相似的人口增长。其中,西部和南部各州的人口增长幅度最大,而中西部和东北部各州的人口增长幅度则小得多。
图 4-2. 2000 年至 2010 年美国人口增长情况。西部和南部各州的增幅最大,而中西部和东北部各州的增幅则小得多(密歇根州的增幅甚至有所下降)。数据来源:美国人口普查局:美国人口普查局。
用颜色表示数据值
颜色还可以用来表示定量数据值,如收入、温度或速度。 在这种情况下,我们使用顺序色标,这种色标包含一连串的颜色,可以清楚地显示哪些数值比其他数值大或小,以及两个特定数值之间的距离。第二点意味着色标需要在整个范围内均匀变化。
序列色阶可以基于单一色相(如从深蓝到浅蓝)或多个色相(如从深红到浅黄)(图 4-3)。多色阶往往遵循自然界中的色彩渐变,如从深红、深绿或深蓝到浅黄,或从深紫到浅绿。反之(如从深黄到浅蓝)则显得不自然,也不能作为有用的顺序标尺。
图 4-3. 顺序色标示例。ColorBrewer Blues 色阶是一个从深蓝到浅蓝的单色色阶。Heat 和 Viridis 色阶是多色阶,分别从深红到浅黄,以及从深蓝经由绿色到浅黄。
当我们想显示不同地理区域的数据值如何变化时,用颜色表示数据值特别有用。 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access