第17章 统计信息的收集和报告
本章我们将学习用于科学计算和统计的高级Python库,其中包括NumPy
、Pandas
、Matplotlib
和Plotly
模块。还将学习数据可视化技术,以及如何绘制收集到的数据。
本章将介绍以下主题。
NumPy
模块。Pandas
模块。- 数据可视化。
17.1 NumPy模块
NumPy
是一个可以高效操作数组的Python模块,它是一个科学计算基础工具包,该包通常用于Python数据分析。NumPy
的数组是由多个值组成的网格。
在终端中运行以下命令来安装NumPy
。
$ pip3 install numpy
接下来我们将使用NumPy
模块操作NumPy
数组。首先创建NumPy
数组,创建一个脚本,命名为simple_array.py
,并在其中添加以下代码。
import numpy as np
my_list1 = [1,2,3,4]
my_array1 = np.array(my_list1)
print(my_list11, type(my_list1))
print(my_array1, type(my_array1))
运行脚本程序,如下所示。
student@ubuntu:~$ python3 simple_array.py
输出如下所示。
[1, 2, 3, 4] <class 'list'>
[1 2 3 4] <class 'numpy.ndarray'>
上面的示例程序将numpy
模块导入为np
,以使用NumPy
功能。然后创建了一个简单的列表,这里使用了np.array()
函数将其转换为NumPy
数组。最后输出了数组并显示了对应数据类型,以便理解普通数组和NumPy
数组的区别。
上面的例子是一维数组,现在我们来看一个多维数组的例子。创建一个脚本,命名为 ...
Get 写给系统管理员的Python脚本编程指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.