第17章 统计信息的收集和报告

本章我们将学习用于科学计算和统计的高级Python库,其中包括NumPyPandasMatplotlibPlotly模块。还将学习数据可视化技术,以及如何绘制收集到的数据。

本章将介绍以下主题。

  • NumPy模块。
  • Pandas模块。
  • 数据可视化。

NumPy是一个可以高效操作数组的Python模块,它是一个科学计算基础工具包,该包通常用于Python数据分析。NumPy的数组是由多个值组成的网格。

在终端中运行以下命令来安装NumPy

$ pip3 install numpy

接下来我们将使用NumPy模块操作NumPy数组。首先创建NumPy数组,创建一个脚本,命名为simple_array.py,并在其中添加以下代码。

import numpy as np

my_list1 = [1,2,3,4]
my_array1 = np.array(my_list1)
print(my_list11, type(my_list1))
print(my_array1, type(my_array1))

运行脚本程序,如下所示。

student@ubuntu:~$ python3 simple_array.py

输出如下所示。

[1, 2, 3, 4] <class 'list'>
[1 2 3 4] <class 'numpy.ndarray'>

上面的示例程序将numpy模块导入为np,以使用NumPy功能。然后创建了一个简单的列表,这里使用了np.array()函数将其转换为NumPy数组。最后输出了数组并显示了对应数据类型,以便理解普通数组和NumPy数组的区别。

上面的例子是一维数组,现在我们来看一个多维数组的例子。创建一个脚本,命名为 ...

Get 写给系统管理员的Python脚本编程指南 now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.