第4章 数据可视化

俗话说“一图胜千言”。通过各种图片和图形化展示,我们可以更清晰地表达很多抽象概念、理论、数据模式或某些想法。在本章中,我们首先解释为什么应该关心数据可视化。然后,我们将讨论几种在R、Python和Julia中常用的数据可视化技术。此外,我们还将介绍几个特殊主题,例如如何生成图形、饼图和条形图,如何添加标题、趋势线、希腊字母,以及如何输出图形。在本章的最后,我们将讨论一个可选话题,即动态表示以及如何将它们保存为HTML文件。

本章包含以下主题:

  • 数据可视化的重要性
  • R数据可视化
  • Python数据可视化
  • Julia数据可视化
  • 绘制简单图形
  • R、Python和Julia的可视化包
  • 动态可视化

对于数据科学和商业分析领域的用户或研究人员来说,使用各种类型的图形、饼图、条形图以及其他视觉手段展示数据中隐含的潜在趋势或模式对理解数据至关重要,同时能够帮助研究人员更好地向观众或客户呈现数据。这样做主要有以下几个原因。

第一,语言有时很难描述我们的发现,尤其是存在几种模式或诸多影响因素时,通过几个单独的图形和一个连接图则可以更好地理解和解释复杂的关系。

第二,我们可以使用图形或图片来解释某些算法,例如二分法(参见4.9节)。

第三,我们也可以使用相对大小来表示不同的含义。在金融领域,一个基本概念叫作货币时间价值(Time Value of Money,TVM),意思是“一鸟在手胜过双鸟在林”。今天的100美元比同等数额的未来现金流更有价值。通过不同尺寸的不同圆圈表示发生在未来不同时间点上的现金流的现值,可以帮助读者更清楚地理解这个概念。

第四,我们的数据可能非常混乱,所以简单地展示数据点可能会使读者更加困惑。如果我们能用一个简单的图形来展示它的主要特征、属性或模式将大有益处。 ...

Get Anaconda数据科学实战 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.