第9章 数据可视化

本章涵盖如下内容:

  • 绘制2D正弦;
  • 绘制直方图;
  • 绘制柱状图;
  • 绘制箱线图或箱须图;
  • 绘制散点图;
  • 绘制甜圈图;
  • 绘制面积图。

在数据科学界,数据可视化正变得越来越流行,它借助点、线、条形把隐藏在数据之下的信息以视觉化方式呈现出来。通过数据可视化,不仅可以把信息传递给数据科学家,还可以把信息直观地呈现给那些不懂(或懂得不多)底层数据分布与数据性质的观众。在许多场合下,管理人、赌金保管人、业务主管会采用数据可视化技术来进行决策或理解变化趋势。

本章分了8个小节来讲解数据可视化,所涉及的可视化图形有正弦图、直观图、柱状图、箱线图、散点图、甜圈图或饼图、面积图。讲解中,我们不会对这些图形的背景知识、优缺点、用法讲太多,但会进行一点简单的介绍。取而代之,我们会把讲解重点放在如何使用Java库来创建这些可视化图形上来。

本章,我们会用到一个Java数据可视化库,它叫GRAL,是GRAphing Library的缩写。本章之所以把GRAL用作数据可视化库,原因有如下几点。

  • 包含的类全面、综合。
  • 包含平滑、缩放、统计、直方图等数据处理功能。
  • 支持绘制广受数据科学家喜爱的图形,包括:xy/散点图、气泡图、折线图、面积图、柱状图、饼图、甜圈图、箱线图、点阵图。
  • 支持图例显示。
  • 支持多种文件格式作为数据源或数据接收器,比如CSV、位图图像数据、音频文件数据。
  • 支持导出位图与矢量文件格式的图形,比如PNG、GIF、JPEG、EPS、PDF、SVG。
  • 占用内存少(大约300k)。

感兴趣的读者,建议前往如下地址查看多个Java数据可视化库的比较:https://github.com/eseifert/gral/wiki/comparison

Get Java数据科学指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.