Skip to Main Content
Erweiterte Analytik mit PySpark
book

Erweiterte Analytik mit PySpark

by Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
September 2024
Intermediate to advanced content levelIntermediate to advanced
236 pages
7h 11m
German
O'Reilly Media, Inc.
Book available
Content preview from Erweiterte Analytik mit PySpark

Kapitel 3. Musikempfehlungen und der Audioscrobbler-Datensatz

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die Empfehlungsmaschine ist eines der populärsten Beispiele für maschinelles Lernen im großen Stil; zum Beispiel ist den meisten Menschen die von Amazon bekannt. Es ist ein gemeinsamer Nenner, weil Empfehlungsmaschinen überall zu finden sind, von sozialen Netzwerken über Videoseiten bis hin zu Online-Händlern. Wir können sie auch direkt in Aktion beobachten. Wir sind uns bewusst, dass ein Computer die Titel auswählt, die auf Spotify gespielt werden sollen, genauso wie wir nicht unbedingt bemerken, dass Gmail entscheidet, ob eine eingehende E-Mail Spam ist.

Der Output eines Recommenders ist intuitiv verständlicher als andere maschinelle Lernalgorithmen. Es ist sogar aufregend. Auch wenn wir glauben, dass Musikgeschmack etwas Persönliches und Unerklärliches ist, können Empfehlungsprogramme erstaunlich gut Titel identifizieren, von denen wir nicht wussten, dass sie uns gefallen würden. In Bereichen wie Musik oder Film, in denen Empfehlungsprogramme häufig eingesetzt werden, ist es vergleichsweise einfach zu erklären, warum ein empfohlenes Musikstück zur Hörgeschichte einer Person passt. Nicht alle Clustering- oder Klassifizierungsalgorithmen passen zu dieser Beschreibung. Ein Support-Vector-Machine-Klassifikator zum Beispiel besteht aus einer Reihe von Koeffizienten, und selbst für Praktiker/innen ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Aufbau von Pipelines für maschinelles Lernen

Aufbau von Pipelines für maschinelles Lernen

Hannes Hapke, Catherine Nelson
Roboter mit ROS

Roboter mit ROS

Murat Calis
Blaupausen für Textanalyse mit Python

Blaupausen für Textanalyse mit Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler

Publisher Resources

ISBN: 9781098190590Supplemental Content