Skip to Main Content
Perl语言入门(第8版)
book

Perl语言入门(第8版)

by Randal L. Schwartz, brian d foy, Tom Phoenix
October 2022
Beginner to intermediate content levelBeginner to intermediate
390 pages
7h 5m
Chinese
Southeast University Press
Content preview from Perl语言入门(第8版)
350
附录C
Unicode
入门
本附录并非关于
Unicode
的完整介绍,我们只是为了帮助你在学习本书时能理解
Unicode
相关部分的内容。之所以说
Unicode
有点难,不光是因为它对字符串有了全
新的理解,有大量调整的词汇表,也因为历史原因,很多计算机语言对它的支持一直
不够完善。
Perl 5.6
以后的版本在
Unicode
方面已经有了非常大的改善,虽然还不是
十分完美,不过也算是你能找得到的最好的对
Unicode
的支持了。
Unicode
Unicode
字符集(
Unicode Character Set
UCS
)是字符(
characters
)到代码点(
code
point
)的抽象关系映射。它和字符在内存中的特定表示方法没有关系,也就是说,
我们在谈论字符时可以不用考虑操作系统的区别,它们在任何一个平台上都总是同一
个实体。而我们讲的编码(
encode
),是指将字符的代码点按照特定形式存储到内存
中的方式,由它建立起抽象字符映射和计算机物理实现之间的桥梁。你可能认为谈到
存储时应该使用“字节(
byte
)”这个术语,不过在我们谈论
Unicode
时应该用术语
8
位位组(
octet
)”(参见图
C-1
)。不同的编码方式存储字符的方式不同。反过
来说,把
8
位位组按照既定的编码方式转换成字符的过程就称为解码(
decode
)。其
实你不用担心这些底层细节,
Perl
已经帮你处理好所有这些内部事务了。
Unicode
入门
351
C-
1
:代码点只是字符代号,并非存储内容。编码就是把字符转换为存储 ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Perl语言入门

Perl语言入门

Randal L. Schwartz, brian d foy, Tom Phoenix
Go程序设计语言

Go程序设计语言

艾伦A. A.多诺万, 布莱恩W. 柯尼汉
Run Llama-2 Models

Run Llama-2 Models

Federico Castanedo

Publisher Resources

ISBN: 9787576602036