거의 일이다. 이번 장에서는 유니코드 문자열, 바이트 시퀀스 그리고 이 둘 간의 변환에 사용되
는 인코딩을 설명한다.
1
여러분이 파이썬으로 수행하는 작업에 따라 유니코드를 이해하는 것이 중요하지 않다고 생각
할 수도 있겠지만, 문자열(
str
)과 바이트(
bytes
)를 구분하지 않고 프로그래밍할 수는 없다.
게다가 특화된 이진 시퀀스형은 ‘범용’ 파이썬
2
의
str
형에 없는 기능도 제공한다.
이번 장에서는 다음과 같은 주제를 다룬다.
●
문자, 코드 포인트
code
point
, 바이트 표현
●
이진 시퀀스의 고유한 특징:
bytes
,
bytearray
,
memoryview
●
전체 유니코드 및 레거시 문자셋에 대한 코덱
1
PyCon
2014
‘파이썬에서의 문자 인코딩과 유니코드(
Character
Encoding
and
Unicode
in
Python
)’ 발표 중
12
번째 슬라이드
(
https ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.