November 2012
Intermediate to advanced
888 pages
54h 46m
Polish
Podziękowania dla Mauro Cicio
Chcemy poznać standard kodowania znaków narodowych w dokumencie, który standardu tego nie podaje explicite.
Należy wykorzystać bindowanie języka Ruby do biblioteki libcharguess. Gdy tylko zostanie ona zainstalowana, jej używanie jest bardzo proste.
Oto przykładowy dokument w języku włoskim, bez jawnej informacji o zastosowanym kodowaniu:
doc = %{<?xml version="1.0"?>
<menu tipo="specialitŕ" giorno="venerdě">
<primo_piatto>spaghetti al ragů</primo_piatto>
<bevanda>frappč</bevanda>
</menu>}
Spróbujmy zidentyfikować jego kodowanie:
require 'charguess' CharGuess::guess doc # => "windows-1252"
Wspaniale: w dokumencie tym zastosowano ...