第3章 数据可视化
正如标题所示,本章描述数据常用的多种可视化表现方法。一图胜千言,好的图形展示常常可以最恰当地表达数字背后的主要思想。斯诺医生的霍乱地图就是一个经典案例。
图3-1是另一个著名示例,故事发生在19世纪。
图3-1 米纳德的“拿破仑东征图”
这张图显示了拿破仑和他的大军在1812年战争期间的行军路线,这次远征从法国到莫斯科再撤退回来。图3-1表达的主要思想是通过前进和后退的线宽代表每个战役地点的军队规模。
3.1 表和图
如图2-12所示,大部分数据保存在表格中,但更常见的表格包含着数千行和许多列。即使是许多文本型或布尔型的数据字段,使用图形汇总也更好理解。
数据有多种不同的图示方法。这里讨论更标准的方法,不讨论那些更有创造性的衍生表现形式,比如米纳德的地图(见图3-1)。
3.1.1 散点图
散点图,也称为散布图,这张图刻画的数据集有两个数值型值标签。如果两个字段标记为x和y,那么散点图就是这些(x,y)点的二维图形。
散点图在Excel中很容易创建。只要在两列中输入数值数据再选择Insert | All Charts | X Y (Scatter)就可以完成。图3-2是一个简单例子。
图3-2 Excel数据
图3-2展示了给定的数据,图3-3展示了对应的散点图。 ...
Get Java数据分析指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.