Rozdział 4. Wyszukiwanie i klasyfikowanie

W rozdziale zostaną omówione wyszukiwarki pełnotekstowe, które umożliwiają przeszukiwanie dużego zbioru dokumentów pod kątem listy wyrazów, a ponadto klasyfikują wyniki zgodnie ze stopniem powiązania dokumentów z tymi wyrazami. Algorytmy wyszukiwania pełnotekstowego zaliczają się do najważniejszych algorytmów inteligencji zbiorowej. Dzięki pomysłom pojawiającym się w tej dziedzinie powstało wiele fortun. Panuje powszechne przekonanie, że za szybkie rozwinięcie rozwiązania firmy Google z projektu akademickiego do najpopularniejszej na świecie wyszukiwarki internetowej w dużej mierze odpowiada algorytm PageRank, który zostanie opisany w tym rozdziale.

Uzyskiwanie informacji to obszerna dziedzina o długiej ...

Get Nowe usługi 2.0. Przewodnik po analizie zbiorów danych now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.