September 2009
Intermediate to advanced
912 pages
48h 11m
German
Sie möchten die innerhalb eines HTML-Dokuments enthaltenen URLs herausziehen.
Verwenden Sie die in Listing 13.10 dargestellte Funktion pc_link_extractor( ).
function pc_link_extractor($s) {
$a = array();
if (preg_match_all('/<a\s+.*?href=[\"\']?([^\"\' >]*)[\"\']?[^>]*>(.*?)<\/a>/i',
$s,$matches,PREG_SET_ORDER)) {
foreach($matches as $match) {
array_push($a,array($match[1],$match[2]));
}
}
return $a;
}Listing 13.10 pc_link_extractor( )
Zum Beispiel:
$links = pc_link_extractor($page);
Die Funktion pc_link_extractor( ) gibt ein Array zurück. Jedes Element dieses Arrays ist selbst wiederum ein Array, dessen erstes Element das Ziel des Links und dessen zweites Element den verlinkten Text ...