book

Python入门指南, 3rd Edition

Name: Python入门指南, 3rd Edition
Author: Bill Lubanovic
ISBN: 9798341668898

by Bill Lubanovic

September 2025

Intermediate to advanced

660 pages

7h 15m

Chinese

O'Reilly Media, Inc.

Read now

Unlock full access

前言
观众第三版的变化概述Python 版本关于作者本书使用的约定使用代码示例O'Reilly 在线学习如何联系我们致谢
I.据点
1.导言
神秘事件Python 小程序设置安装 Python升级 Python运行 Python 程序Python 交互式解释器Python 文件Python 内置功能Python 标准库第三方 Python 软件包更大的示例回顾/预览
2.类型和变量
计算机位和字节多字节类型变量为变量赋值更改变量值删除变量为变量命名遵循命名约定Python 类型指定值对象是内存中的塑料盒复习/预览练习
3.数字
布尔值整数字面整数整数运算整数和变量优先级基数类型转换整数有多大？浮点数浮点数不精确分数小数数学函数复习/预习练习
4.字符串
使用引号创建用 str() 创建用 \ 转义用 + 合并用 * 重复通过 [ 偏移量 ] 获取字符用 Slice 获取子串用 len() 获取长度用 split() 分割用 join() 合并用 replace() 代替处理前缀和后缀使用 strip() 进行剥离搜索和选择更改大小写设置对齐方式应用格式化旧式：%新样式{} 和 format()最新样式：f-字符串回顾/预览练习
5.字节和字节数组
字节使用引号创建使用 bytes() 创建从十六进制字符串创建对字节和字符串进行解码和编码转换为十六进制字符串通过 [ 偏移量 ] 获取一个字节获取片段用 + 组合用 * 重复字节数组用 bytearray() 创建通过 [ 偏移量 ] 获取一个字节用片段获取多个字节通过 [ 偏移量 ] 修改一个字节用 replace() 修改多个字节用切片修改多个字节使用 insert() 插入一个字节使用 append() 追加一个字节使用 extend() 追加多个字节用 + 合并用 * 重复审查/预览实践
6.如果和匹配
用 # 注释用 \ 继续行与 if、elif 和 else 比较什么为真？用 in 进行多重比较新内容：我是海象匹配简单匹配结构匹配复习/预习练习
7.For 和 While
用 while 重复用 break 取消用 continue 向前跳转检查中断使用 else使用 for 和 in 进行迭代器用中断取消用继续跳过使用 else使用 range() 生成数字序列复习/预览练习
8.元组和列表
元组用逗号和（）创建用 tuple() 创建通过 [ 偏移量 ] 获取项用 + 组合用 * 重复比较用 for 和 in 迭代器修改？列表用 [] 创建用 list() 创建或转换用 split() 从字符串创建通过 [ 偏移量 ] 获取项目用片段获取项目使用 append() 将项目添加到尾部使用 insert() 通过偏移量添加项目用 * 复制用 extend() 或 + 合并使用 [ 偏移量 ] 更改项目使用切片更改项目使用 del 按偏移量删除项目使用 remove() 按值删除项目使用 pop() 通过偏移量获取并删除项目使用 clear() 删除所有项目使用 index() 通过值查找项的偏移量使用 in 测试值使用 count() 计算值的出现次数使用 join() 将列表转换为字符串使用 sort() 或 sorted() 对项目重新排序使用 len() 获取长度使用 = 进行赋值用 copy()、list() 或 Slice 复制使用 deepcopy() 复制所有内容比较列表用 for 和 in 进行迭代器迭代用 zip() 迭代多个序列用 zip_longest()迭代多个序列通过理解创建列表创建列表的列表元组与列表没有元组理解复习/预览练习

9.字典和集合
字典用 {} 创建列表使用 dict() 创建列表使用 dict() 进行转换通过 [ 关键字 ] 添加或更改项目通过 [ 键 ] 或使用 get() 获取项目使用 for 和 in 迭代器使用 len() 获取长度组合/更新 dict使用 del 按键删除项目通过 pop( key ) 按键获取并删除项目使用 clear() 删除所有项目使用 in 测试键使用 = 进行分配使用 copy() 复制使用 deepcopy() 复制所有内容比较字典使用字典理解集合使用 set() 或 {} 创建字典使用 len() 获取长度使用 add() 添加项使用 remove() 删除项使用 | 组合使用 for 和 in 进行迭代器用 in 测试值使用组合和运算符创建集合综合使用 frozenset() 创建不可变集合复习/预览练习
10.函数
用 def 定义函数用括号调用函数参数无、真和假位置参数关键字参数默认参数值用 * 打包/解包位置参数打包/解包带 ** 的关键字参数仅限关键字 (*) 和仅限位置 (/) 参数可变和不可变参数文档字符串函数是一等公民函数参数不是元组内部函数闭包匿名函数：Lambda生成器生成器函数生成器理解装饰器命名空间和范围冗余名称递归异步函数简介异常使用 try 和 except 处理错误使用 Finally创建自己的异常回顾/预览实践
11.对象
什么是对象？简单对象用 class 定义类分配属性方法初始化继承从父类继承覆盖方法添加方法使用 super() 从父类获得帮助使用多重继承包含混合类自卫属性访问直接访问获取器和设置器属性访问属性计算值属性名称混淆以保护隐私类和对象属性方法类型实例方法类方法静态方法鸭子打字魔法方法聚合与组合何时使用对象或其他方法命名元组数据类属性回顾/预览实践
12.模块和包
模块和导入语句导入模块导入另一个名称的模块只导入模块中的内容包模块搜索路径相对导入和绝对导入名称空间包模块与对象Python 标准库中的好东西使用 setdefault() 和 defaultdict() 处理缺失键使用 Counter() 计数项目使用 OrderedDict() 按键排序堆栈 + 队列 == deque用 itertools 遍历代码结构获取随机数更多电池获取其他 Python 代码回顾/预览实践
II.工具
13.开发环境
查找 Python 代码安装包使用 Pip使用本地软件包管理器安装从源代码安装虚拟环境Virtualenv 和 VenvPipenv诗歌Condauv集成开发环境IPythonJupyter 笔记本JupyterLab源代码控制MercurialGit回顾/预览实践
14.类型提示和文档
类型提示变量提示函数提示Mypy文档注释文档字符串标记文本文件回顾/预览实践
15.测试
PylintRuffUnittest测试Pytest示例固定装置参数化假设Nox持续集成审查/预览实践
16.调试
断言打印F 字符串Pprint()冰淇淋装饰器记录Pdb断点回顾/预览实践
III.任务
17.文本数据
文本字符串：文本字符串：UnicodePython 统一码字符串UTF-8编码解码HTML 实体规范化文本字符串：Unicode正则表达式使用 match() 查找完全匹配的开头部分使用 search() 查找第一个匹配项使用 findall() 查找所有匹配项使用 split() 分割匹配项使用 sub() 替换匹配项模式使用特殊字符使用指定符指定 match() 输出复习/预览练习
18.二进制数据
用结构体转换二进制数据使用二进制数据工具提取使用 binascii() 转换字节/字符串使用位操作符复习/预览练习
19.日期和时间
闰年日期模块时间模块读写日期和时间所有转换其他模块回顾/预览练习
20.文件
文件输入和输出使用 open() 创建或打开文本文件使用 print() 写入文本文件使用 write() 写入文本文件用 read()、readline() 或 readlines() 读取文本文件用 write() 写二进制文件使用 read() 读取二进制文件使用 with() 自动关闭文件使用 seek() 更改位置记忆映射文件操作使用 exists() 检查文件是否存在使用 isfile() 检查类型使用 copy() 复制文件使用 rename() 更改文件名使用 link() 或 symlink() 进行链接使用 chmod() 更改权限使用 chown() 更改所有权使用 remove() 删除文件目录操作使用 mkdir() 创建文件使用 rmdir() 删除文件使用 listdir() 列出目录内容使用 chdir() 更改当前目录使用 glob() 列出匹配文件路径名使用 abspath() 获取路径名使用 realpath() 获取符号链接路径名使用 os.path.join() 创建路径名使用 pathlib字节IO 和字符串IO文件格式：确定复习/预览练习
21.时间中的数据：并发
程序和进程使用子进程创建进程使用多进程创建进程使用 terminate() 终止进程使用 os 获取系统信息使用 psutil 获取进程信息命令自动化调用其他命令助手并发队列进程线程GIL并发期货绿色线程和 gevent扭曲多线程例程和事件循环异步替代方案异步与事件循环异步框架和服务器Redis队列之外回顾/预览实践
22.空间中的数据Network+ 网络
TCP/IP套接字Scapy网猫Network+ 模式请求-回复模式请求-回复ZeroMQ请求-回复其他消息传递工具发布-订阅模式发布-分送： Redis发布-分送：ZeroMQ发布-分送：其他工具互联网服务域名系统Python 电子邮件模块其他协议网络服务和 API数据序列化使用 pickle 进行序列化使用其他序列化格式远程过程调用XML RPCJSON RPC消息包 RPCzerorpcgRPC远程管理大数据HadoopSparkDiscoDask云亚马逊网络服务谷歌云微软 AzureOpenStackDockerKubernetes审查/预览实践
23.盒中数据持久存储
文本文件表格和分隔文本文件CSVXMLXML 安全说明HTMLJSONYAMLTOML标签页配置文件二进制文件填充二进制文件和内存映射电子表格HDF5TileDB关系数据库SQLDB-APISQLiteDuckDBMySQLPostgreSQLSQLAlchemy其他数据库访问软件包NoSQL 数据存储dbm 系列MemcachedRedisRedis 替代品：Valkey?文档数据库时间序列数据库图数据库其他 NoSQL全文数据库向量数据库地理空间数据库审查/预览实践
24.网络
网络基础知识HTTP 测试远程登录curlHTTPiehttpbin网络客户端标准库请求其他网络客户端网络服务器最简单的 Python 网络服务器网络服务器网关接口ASGIApacheNGINX其他 Python Web 服务器网络服务器框架瓶子FlaskDjangoFastAPILitestar数据库框架网络服务和自动化网页浏览器网页视图网络 API 和 RESTWebSockets网络钩子网络前端htmxFastHTML抓取和扫描Scrapy美丽汤请求-HTML观看电影回顾/预览实践
25.数据科学
标准 Python格式转换数学复数计算带小数的精确浮点数值用分数进行有理数运算使用数组的打包序列统计矩阵乘法NumPy用 array() 制作数组使用 arange() 制作数组使用 0()、1() 或 random() 创建数组使用 reshape() 改变数组的形状使用 [] 获取元素数组数学线性代数SciPy熊猫极地DuckDB数据可视化回顾/预览实践
26.人工智能
原来...专家系统感知器突破图像识别：ImageNet 和 AlexNet大型语言模型ChatGPT 时刻检索代理效率创建模型：Python 框架当前模型百万模型：拥抱的脸使用 Ollama 的工作示例安装 Ollama选择模型选择其他模式奥拉玛案例参考资料回顾/预览实践
27.性能
计算机硬件测量计时简介算法和数据结构数组与列表和元组缓存CythonNumPy 和 SciPyC 或 Rust 扩展太极PyPyNumba标准 Python JIT魔咒背景介绍设计范例局限性结论审查/预览练习
附录。练习答案
2.类型和变量3.数字4.字符串5.字节和字节数组6.如果和匹配7.For 和 While8.元组和列表9.字典和集合10.函数11.对象12.模块和包13.开发环境14.类型提示和文档15.测试16.调试17.文本数据18.二进制数据19.日期和时间20.文件21.时间中的数据：并发22.空间中的数据Network+ 网络23.盒中数据持久存储24.网络25.数据科学26.人工智能27.性能
索引
关于作者

Content preview from Python入门指南, 3rd Edition

第 25 章数据科学数据科学

本作品已使用人工智能进行翻译。欢迎您提供反馈和意见：translation-feedback@oreilly.com

在数据面前空谈理论是大错特错的。

福尔摩斯

世界是混乱的，数据也是如此。¹ 你需要花费大量的时间来清理、合并、拆分和推动数据，以获得你需要的东西。

Python 已成为最流行的计算机语言，部分原因是许多开发人员采用它来处理他们的克星--数据。本章涉及广泛的数据主题，包括这些：

数据处理
格式转换
分析和统计
可视化

我将首先讨论当你打开并摇动标准 Python 盒子时会得到什么。然后，我将深入探讨人们为驯服数据而编写的丰富的第三方工具。

人工智能得等到下一章了，我敢打赌，它肯定没预料到这一点。

标准 Python

首先，，让我们来看看我还没有提到的一些 Python 功能。

我在第 8 章中提到过sort() 和sorted()，但只适用于列表。operator 模块有方便的函数itemgetter()和attrgetter()，可以告诉sort() 和sorted()如何进行排序。

基本的itemgetter() 函数会从一个可迭代器中返回一个或多个项--一个可以让你用[] 访问项的对象，就像列表或元组一样：

>>> from operator import itemgetter
>>> l = ['a', 'b', 'c', 'd', 'e']
>>> f = itemgetter(2)
>>> f(l)
'c'

如果给itemgetter() 多个索引，它将返回一个元组：

>>> f = itemgetter(3, 2, 1)
>>> f(l)
('d', 'c', 'b')

常见的用法是对可迭代器进行排序，比如下面的列表。它会在每个子列表中查找索引1 ，得到项目y 、e 和b ，然后按这些值对它们的列表进行排序：

>>> l = [ ['x', 'y', 'z'], ['d', 'e', 'f'], ['a', 'b', 'c'] ]
>>> x = sorted(l, key=itemgetter(1))
>>> x
[['a', 'b', 'c'], ['d', 'e', 'f'], ['x', 'y', 'z']]

试试用字符串列表代替列表列表：

>>> l = [ 'xyz', 'def', 'abc' ]
>>> x = sorted(l, key=itemgetter(1))
>>> x
['abc', 'def', 'xyz']

这也适用于二进制文件，因为二进制文件允许通过键值而不是索引进行访问。让我们通过sym （符号）键值对化学元素二进制文件列表进行排序：

>>> from operator import itemgetter
>>> l = [ {'sym': 'C', 'wt': 12},
... {'sym': 'H', 'wt': 1},
... {'sym': 'Be', 'wt': 9}
... ]
>>> f = itemgetter('sym')
>>> x = sorted(l, key=f)
>>> x
[{'sym': 'Be', 'wt': 9}, {'sym': 'C', 'wt': 12}, {'sym': 'H', 'wt': 1}]
>>> f = itemgetter('wt')
>>> x = sorted(l, key=f)
>>> x
[{'sym': 'H', 'wt': 1}, {'sym': 'Be', ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

O’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.

Julian F.

Head of Cybersecurity

I wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.

Addison B.

Field Engineer

I’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.

Amir M.

Data Platform Tech Lead

I'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.

Mark W.

Embedded Software Engineer

Publisher Resources

ISBN: 9798341668898

Cloud Computing

Data Engineering

Data Science

AI & ML

Programming Languages

Software Architecture

IT/Ops

Security

Design

Business

Soft Skills

Python入门指南, 3rd Edition

by Bill Lubanovic

第 25 章数据科学数据科学

标准 Python

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

生成式人工智能设计模式

Small Signal Audio Design, 3rd Edition

21世纪C语言，第2版

The Book of R, 2nd Edition

Publisher Resources

第 25 章 数据科学 数据科学

标准 Python

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,and much more.

More than 5,000 organizations count on O’Reilly

Julian F.

Addison B.

Amir M.

Mark W.

You might also like

生成式人工智能设计模式

Small Signal Audio Design, 3rd Edition

21世纪C语言，第2版

The Book of R, 2nd Edition

Publisher Resources

第 25 章数据科学数据科学

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.