Rozdział 9. Odczyt i zapis języków naturalnych

Dotychczas dane, na których pracowaliśmy, miały najczęściej postać liczb lub wartości policzalnych. W większości przypadków przechowywaliśmy informacje bez konieczności dalszej ich analizy. W niniejszym rozdziale spróbujemy zająć się niełatwą kwestią języka angielskiego[1].

Skąd wyszukiwarka Google wie, że chodzi nam o uroczego kociaka, gdy wpiszemy frazę „cute kitten” w serwisie Image Search? Jest to możliwe, ponieważ wyrażenie to „otacza” obrazy uroczego kociaka. W jaki sposób serwis YouTube potrafi wyświetlić odpowiedni skecz Monty Pythona po wpisaniu słów „Dead Parrot” (martwa papuga) w pasku wyszukiwania? Jest to możliwe dzięki tytułowi i tekstowi opisowemu dołączonym do każdego przesłanego ...

Get Ekstrakcja danych z językiem Python now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.