7.10. Wyodrębnianie nazwy hosta z adresu URL

Problem

Chcemy wyodrębnić nazwę hosta z łańcucha zawierającego adres URL. Na przykład z adresu URL http://www.regexcookbook.com/ chcielibyśmy wyodrębnić fragment www.regexcookbook.com.

Rozwiązanie

Wyodrębnianie nazwy hosta z adresu URL, o którym wiadomo, że jest prawidłowy

 • \A
  [a-z][a-z0-9+\-.]*://       # Schemat
  ([a-z0-9\-._~%!$&'()*+,;=]+@)?   # Użytkownik
  ([a-z0-9\-._~%]+          # Nazwany host lub host IPv4
  |\[[a-z0-9\-._~%!$&'()*+,;=:]+\]) # Host IPv6+
  • Opcje wyrażenia regularnego: Swobodne stosowanie znaków białych, ignorowanie wielkości liter

  • Odmiany wyrażeń regularnych: .NET, Java, JavaScript, PCRE, Perl, Python, Ruby

 • ^[a-z][a-z0-9+\-.]*://([a-z0-9\-._~%!$&'()*+,;=]+@)?([a-z0-9\-._~%]+|\[[a-z0-9\
  -._~%!$&'()*+,;=:]+\]) ...

Get Wyrażenia regularne. Receptury now with O’Reilly online learning.

O’Reilly members experience live online training, plus books, videos, and digital content from 200+ publishers.