September 2009
Intermediate to advanced
912 pages
48h 11m
German
Sie möchten Text auslesen, der sich innerhalb von HTML-Tags befindet. Zum Beispiel möchten Sie alle Überschriften in einem HTML-Dokument finden.
Lesen Sie die HTML-Datei in einen String ein und führen Sie nicht-gieriges Matching mit Ihrem Muster durch:
$html = join('',file($file));
preg_match('#<h([1-6])>(.+?)</h\1>#is', $html, $matches);In diesem Beispiel enthält $matches[2] ein Array mit den ausgelesenen Überschriften.
Es ist schwierig, HTML-Code mit einfachen regulären Ausdrücken korrekt zu analysieren. Einer der Vorteile von XHTML ist, dass es deutlich einfacher zu validieren und zu zerlegen ist.
Zu Beginn des Suchmusters sehen wir, dass das Ergebnis der Zahlengruppe [1-6] mit runden ...