O'Reilly logo

PHP 5 Kochbuch, Third Edition by Stephan Schmidt, Ulrich Speidel, Matthias Brusdeylins, Carsten Lucke, Adam Trachtenberg, David Sklar

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

13.12 HTML in ASCII konvertieren

Problem

Sie müssen eine HTML-Seite in lesbaren, formatierten ASCII-Text umwandeln.

Lösung

Wenn Sie über ein externes Programm wie lynx verfügen, das HTML als ASCII formatiert, können Sie es folgendermaßen aufrufen:

$file = escapeshellarg($file);
$ascii = `lynx -dump $file`;

Diskussion

Verfügen Sie über kein externes Programm zum Formatieren, können Sie mit der Funktion pc_html2ascii( ) aus Listing 13.12 immerhin eine Untermenge der HTML-Codes verarbeiten (allerdings keine Tabellen und Frames).

function pc_html2ascii($s) { // Links konvertieren. $s = preg_replace('/<a\s+.*?href="?([^\" >]*)"?[^>]*>(.*?)<\/a>/i', '$2 ($1)', $s); // Die Tags <br>, <hr>, <p>, <div> in Zeilenumbrüche umwandeln. $s = preg_replace('@<(b|h)r[^>]*>@i',"\n",$s); ...

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, interactive tutorials, and more.

Start Free Trial

No credit card required