Skip to Main Content
Ruby. Receptury
book

Ruby. Receptury

by Lucas Carlson, Leonard Richardson
November 2012
Intermediate to advanced content levelIntermediate to advanced
888 pages
54h 46m
Polish
Helion
Content preview from Ruby. Receptury

11.5. Parsowanie błędnych dokumentów

Problem

Chcemy wydobyć informację z dokumentu, który wydaje się być dokumentem HTML lub XML, lecz zawiera błędy składniowe.

Rozwiązanie

W charakterze doraźnego rozwiązania można wykorzystać bibliotekę Rubyful Soup, napisaną przez Leonarda Richardsona i dostępną w gemie rubyful_soup. Umożliwia ona budowanie modelu dokumentu także na podstawie błędnej zawartości dokumentów XML i HTML, oferując przy tym podejście idiomatyczne dla języka Ruby. Nadaje się idealnie w charakterze „lekarza pierwszego kontaktu” dla niepoprawnych dokumentów HTML.

require 'rubygems' require 'rubyful_soup' invalid_html = 'A lot of <b class=1>tags are <i class=2>never closed.' soup = BeautifulSoup.new(invalid_html) puts soup.prettify ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

ReasonML Quick Start Guide

ReasonML Quick Start Guide

Raphael Rafatpanah, Bruno Joseph D'mello
Microsoft Excel: Formeln & Funktionen - Das Maxibuch, 3., aktualisierte und erweiterte Auflage

Microsoft Excel: Formeln & Funktionen - Das Maxibuch, 3., aktualisierte und erweiterte Auflage

Egbert Jeschke, Eckehard Pfeifer, Helmut Reinke, Sara Unverhau, Bodo Fienitz
Mastering Ruby Closures

Mastering Ruby Closures

Benjamin Tan Wei Hao

Publisher Resources

ISBN: 9781457177453Errata Page