7.10. Wyodrębnianie nazwy hosta z adresu URL

Problem

Chcemy wyodrębnić nazwę hosta z łańcucha zawierającego adres URL. Na przykład z adresu URL http://www.regexcookbook.com/ chcielibyśmy wyodrębnić fragment www.regexcookbook.com.

Rozwiązanie

Wyodrębnianie nazwy hosta z adresu URL, o którym wiadomo, że jest prawidłowy

  • \A
    [a-z][a-z0-9+\-.]*://              # Schemat
    ([a-z0-9\-._~%!$&'()*+,;=]+@)?     # Użytkownik
    ([a-z0-9\-._~%]+                   # Nazwany host lub host IPv4
    |\[[a-z0-9\-._~%!$&'()*+,;=:]+\])  # Host IPv6+
    • Opcje wyrażenia regularnego: Swobodne stosowanie znaków białych, ignorowanie wielkości liter

    • Odmiany wyrażeń regularnych: .NET, Java, JavaScript, PCRE, Perl, Python, Ruby

  • ^[a-z][a-z0-9+\-.]*://([a-z0-9\-._~%!$&'()*+,;=]+@)?([a-z0-9\-._~%]+|\[[a-z0-9\
    -._~%!$&'()*+,;=:]+\]) ...

Get Wyrażenia regularne. Receptury now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.