第2章 字符串与集合类型
Python包含丰富的内置集合类型,它们一般可以满足非常复杂的程序,而无须依靠自定义的数据结构。本章会介绍这些基本的集合类型(它们足以让我们编写一些有趣的代码)。我们将在后面的章节中再次讨论这些集合类型,同时还有其他几个集合类型。
本章主要介绍以下这些类型:
str
——不可变的Unicode码位序列;bytes
——不可变的字节序列;list
——可变的对象序列;dict
——可变的键值映射。
本章还将介绍一下Python的for
循环。
2.1 str——不可变的Unicode码位序列
Python中的字符串数据类型——str
,我们已经频繁地使用了它们。字符串是Unicode码位的序列。在大多数情况下,你可以将码位视为类似字符的东西,尽管它们不是严格等同的。Python字符串中的码位序列是不可变的,所以一旦构建了一个字符串,就不能修改它的内容。
码位、字母、字符和符号之间的区别可能令人困惑。我们试着用一个例子来解释一下:希腊字母Σ会被广泛应用于希腊文的写作中,同时,数学家用它来表示序列的求和。字母Σ的这两个用途分别用不同的Unicode字符表示,称为GREEK CAPITAL LETTER SIGMA和N-ARY SUMMATION。通常,使用相同的字母传达不同的信息时,会使用不同的Unicode字符。另一个例子是GREEK CAPITAL LETTER OMEGA和OHM SIGN,这是电阻单位的标志。码位是组成码空间的数值。每个字符与单个码位相关联,因此,把U+03A3
分配给了GREEK CAPITAL LETTER SIGMA,同时把U+2211
分配给了N-ARY SUMMATION。如上所述,我们通常将码位写成U+nnnn形式,其中nnnn是4位、5位或6位十六进制数。并非所有码位都已分配给字符。例如, ...
Get Python实用技能学习指南 now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.