May 2010
Intermediate to advanced
520 pages
17h 44m
Polish
HTML (od ang. Hypertext Markup Language) służy do opisywania struktury, treści i wyglądu miliardów stron internetowych i innych dokumentów. Przetwarzanie danych w tym języku z wykorzystaniem wyrażeń regularnych należy do najczęstszych zadań w dzisiejszych aplikacjach. Warto więc od razu podkreślić, że HTML jest wyjątkowo niewdzięcznym obiektem przetwarzania za pomocą tego rodzaju wyrażeń, szczególnie jeśli oczekujemy wysokiej niezawodności i precyzji tego przetwarzania. Najbardziej kłopotliwe są dokumenty cechujące się niedbałą strukturą, co w przypadku stron internetowych zdarza się bardzo często (po części wskutek tolerowania przez współczesne przeglądarki internetowe nawet najgorzej skonstruowanych stron). ...