O'Reilly logo

Bash. Receptury by Cameron Newham, JP Vossen, Carl Albing

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

13.3. Interpretacja kodu HTML

Problem

Chcemy wyodrębnić określone ciągi tekstowe z kodu HTML. Przykładem może być konieczność pobrania fragmentu href="adresurl" ze znacznika <a> umieszczonego w dokumencie HTML.

Rozwiązanie

Jeżeli problem dotyczy rozwiązania, które powinno być przygotowane szybko i nie musi mieć uniwersalnego charakteru, wystarczy wykorzystać następujące polecenie:

cat plik | sed –e 's/>/>\
/g' | grep '<a' | while IFS='"' read a b c ; do echo $b; done

Analiza

Interpretacja dokumentu HTML w skrypcie powłoki bash jest dość trudna, ponieważ interpreter bash przetwarza dane wiersz po wierszu, natomiast interpretery HTML są zaprojektowane w taki sposób, aby traktowały znaki nowego wiersza jako znaki odstępu. Zapisywanie znaczników w kilku ...

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, interactive tutorials, and more.

Start Free Trial

No credit card required