October 2018
Intermediate to advanced
296 pages
8h 55m
Polish
Och, naturo, naturo, dlaczego jesteś taka nieuczciwa i wysyłasz ludzi w świat z fałszywymi rekomendacjami!
— Henry Fielding
Generowanie różnych rekomendacji to kolejny problem analityczny. Serwis Netflix rekomenduje filmy, które możesz chcieć obejrzeć. Amazon poleca produkty, które możesz zechcieć kupić. Twitter poleca użytkowników, których możesz zechcieć śledzić. W tym rozdziale przyjrzymy się kilku sposobom korzystania z danych w celu generowania rekomendacji.
Będziemy pracować z zaprezentowanym wcześniej zbiorem zainteresowań użytkowników user_interests:
users_interests = [
[“Hadoop”, “Big Data”, “HBase”, “Java”, “Spark”, “Storm”, “Cassandra”],
[“NoSQL”, “MongoDB”, “Cassandra”, “HBase”, “Postgres”], ...