第 3 章 坐标系和坐标轴 坐标系和坐标轴
本作品已使用人工智能进行翻译。欢迎您提供反馈和意见:translation-feedback@oreilly.com
要制作任何形式的数据可视化,我们都需要定义位置标度,它决定了不同数据值在图形中的位置。如果不将不同的数据点放置在不同的位置,我们就无法实现数据的可视化,即使我们只是将它们沿着一条线相邻排列。对于常规的二维可视化,需要两个数字来唯一指定一个点,因此我们需要两个位置标度。 这两个标度通常是但不一定是图形的x轴和y轴。我们还必须指定这些刻度的相对几何排列。通常情况下,x轴水平放置,y轴垂直放置,但我们也可以选择其他排列方式。例如,我们可以让y轴与x轴成锐角运行,或者让一个轴沿圆周运行,另一个轴沿径向运行。 一组位置刻度及其相对几何排列的组合称为坐标系。
笛卡尔坐标
数据可视化最广泛使用的坐标系是二维笛卡尔坐标系,其中每个位置都由x和y值唯一指定。x轴和y轴相互正交,数据值沿两个轴均匀分布(图 3-1)。这两个坐标轴是连续的位置标尺,既可以表示正实数,也可以表示负实数。 要完全指定坐标系,我们需要指定每个坐标轴所涵盖的数字范围。在图 3-1 中,x轴从 -2.2 到 3.2,y轴从 -2.2 到 2.2。介于这些坐标轴界限之间的任何数据值都会被放置在图中相应的位置。任何超出轴限值的数据值都会被丢弃。
图 3-1. 标准直角坐标系。横轴通常称为x轴,纵轴称为y 轴。在这里,x和y网格线之间的间隔单位都是 1。点(2,1)位于原点(0,0)的右侧两个x单位和上方一个y单位处。点(-1,-1)位于原点左侧一个x单位和原点下方一个y单位处。
不过,数据值通常不仅仅是数字。例如,如果我们测量的是温度,数值可以用摄氏度或华氏度来衡量。同样,如果我们测量的是距离,数值的单位可能是公里或英里;如果我们测量的是持续时间,数值的单位可能是分钟、小时或天。在直角坐标系中,沿坐标轴的网格线之间的间距与这些数据单位的离散级数相对应。 例如,在温标中,我们可以每隔 10 华氏度设置一条网格线,而在距离标中,我们可以每隔 5 公里设置一条网格线。
笛卡尔坐标系的两个坐标轴可以代表两种不同的单位。例如,在图 2-3 中,我们绘制了气温与全年天数的关系图。图 2-3的y轴以华氏度为单位,每隔 20 度有一条网格线,而x轴以月为单位,每隔三个月的第一个月有一条网格线。只要两个坐标轴的测量单位不同,我们就可以拉伸或压缩其中一个坐标轴,并保持数据的可视化(图 3-2)。哪个版本更可取,可能取决于我们想要表达的故事。又高又窄的图形强调的是沿y轴的变化,而又短又宽的图形则恰恰相反。理想情况下,我们要选择一个长宽比,以确保任何重要的位置差异都能被注意到。
图 3-2. 德克萨斯州休斯顿的日平均气温。温度映射到y轴,年份映射到x轴。(a)、(b)和(c)部分以不同的纵横比显示了同一图表。所有三个部分都是气温数据的有效可视化。数据来源:NOAA.
另一方面,如果x轴和y轴的测量单位相同,则两个轴的网格间距应相等,这样x轴或y轴上的相同距离就对应相同数量的数据单位。例如,我们可以将德克萨斯州休斯顿市一年中每天的温度与加利福尼亚州圣地亚哥市一年中每天的温度进行对比绘制 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access