Skip to Main Content
Ruby. Receptury
book

Ruby. Receptury

by Lucas Carlson, Leonard Richardson
November 2012
Intermediate to advanced content levelIntermediate to advanced
888 pages
54h 46m
Polish
Helion
Content preview from Ruby. Receptury

11.13. Ekstrakcja wszystkich adresów URL z dokumentu HTML

Problem

Chcemy odnaleźć wszystkie lokalizatory URL na danej stronie WWW.

Rozwiązanie

Czy chodzi jedynie o hiperłącza (czyli URL-e stanowiące wartość atrybutu HREF w znaczniku <A)? Czy może interesują nas również URL-e w osadzonych obiektach — obrazkach lub apletach? A może po prostu chcemy odnaleźć wszystkie URL-e, także te wymienione w treści strony?

Wbrew pozorom, ten ostatni przypadek jest najprostszy. Ekstrakcję URL-i przeprowadzić można za pomocą metody URI.extract; możemy zażądać wyodrębnienia wszystkich URL-i w danym łańcuchu bądź ograniczyć się tylko do ich podzbioru. W poniższym przykładzie wykorzystujemy zarówno pierwszą, jak i drugą możliwość:

require 'uri' text = ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

ReasonML Quick Start Guide

ReasonML Quick Start Guide

Raphael Rafatpanah, Bruno Joseph D'mello
Microsoft Excel: Formeln & Funktionen - Das Maxibuch, 3., aktualisierte und erweiterte Auflage

Microsoft Excel: Formeln & Funktionen - Das Maxibuch, 3., aktualisierte und erweiterte Auflage

Egbert Jeschke, Eckehard Pfeifer, Helmut Reinke, Sara Unverhau, Bodo Fienitz
Mastering Ruby Closures

Mastering Ruby Closures

Benjamin Tan Wei Hao

Publisher Resources

ISBN: 9781457177453Errata Page