지 않은 바이트였다. 문자 인코딩을 알고 있다는 가정 하에 유니코드로 변환할 수 있었다. 다음
예제를 살펴보자.
In
[
76
]:
val
=
"
espa
ñ
ol
"
In
[
77
]:
val
Out
[
77
]:
'
espa
ñ
ol
'
encode
메서드를 사용해서 위 유니코드 문자열을
UTF
-
8
바이트 표현으로 변환할 수 있다.
In
[
78
]:
val
_
utf8
=
val
.
encode
('
utf
-
8
')
In
[
79
]:
val
_
utf8
Out
[
79
]:
b
'
espa
\
xc3
\
xb1ol
'
In
[
80
]:
type
(
val
_
utf8
)
Out
[
80
]:
bytes
bytes
객체의 유니코드 인코딩을 알고 있다면
decode
메서드를 이용해서 다시 거꾸로 되돌릴
수 있다.
In
[
81
]:
val
_
utf8
.
decode
('
utf
-
8
')
Out
[
81
]:
'
espa
ñ
ol
'
모든 인코딩에
UTF
-
8
을 사용하는 것이 선호되는 추세이긴 하지만, 여러 가지 다른 인코딩을
사용하는 데이터를 만나게 될 수도 있다.
In
[
82
]:
val
.
encode
('
latin1
')
Out
[
82
]:
b
'
espa
\
xf1ol
'
In
[
83
]:
val
.
encode
('
utf
-
16
')
Out
[
83
]:
b
'\
xff
\
xfee
\
x00s
\
x00p
\
x00a
\
x00
\
xf1
\
x00o
\
x00l
\
x00
'
In
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month, and much more.