June 2012
Intermediate to advanced
136 pages
2h 50m
German
Die Unicode-Zeichenkodierung ordnet den Zeichen aller Sprachen dieser Welt eindeutige Werte zu. Aufgrund der großen Zahl möglicher Zeichen benötigt Unicode mehr als ein Byte, um ein Zeichen darzustellen. Einige Regex-Implementierungen verstehen keine Unicode-Zeichen, da sie 1 Byte lange ASCII-Zeichen erwarten. Die grundlegende Unterstützung für Unicode-Zeichen beginnt mit der Fähigkeit, einen literalen String von Unicode-Zeichen erkennen zu können. Eine leistungsfähigere Unterstützung umfasst Zeichenklassen und andere Konstrukte, die Zeichen aller durch Unicode unterstützten Sprachen enthalten. Zum Beispiel muss \w dann è ebenso erkennen wie e.
Read now
Unlock full access