Skip to Content
Erweiterte Analytik mit PySpark
book

Erweiterte Analytik mit PySpark

by Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen, Josh Wills
September 2024
Intermediate to advanced
236 pages
7h 11m
German
O'Reilly Media, Inc.

Overview

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Die Menge an Daten, die heute erzeugt wird, ist atemberaubend und wächst weiter. Apache Spark hat sich zum De-facto-Werkzeug für die Analyse von Big Data entwickelt und ist heute ein wichtiger Bestandteil der Data-Science-Toolbox. Dieser praktische Leitfaden wurde für Spark 3.0 aktualisiert und bringt Spark, statistische Methoden und reale Datensätze zusammen, um dir zu zeigen, wie du mit PySpark, der Python-API von Spark, und anderen Best Practices der Spark-Programmierung an Analyseprobleme herangehst.

Die Datenwissenschaftler Akash Tandon, Sandy Ryza, Uri Laserson, Sean Owen und Josh Wills geben eine Einführung in das Spark-Ökosystem und zeigen dann, wie gängige Techniken wie Klassifizierung, Clustering, kollaboratives Filtern und Anomalieerkennung in Bereichen wie Genomik, Sicherheit und Finanzen angewendet werden. Diese aktualisierte Ausgabe deckt auch NLP und Bildverarbeitung ab.

Wenn du ein grundlegendes Verständnis von maschinellem Lernen und Statistik hast und in Python programmierst, wird dir dieses Buch den Einstieg in die groß angelegte Datenanalyse erleichtern.

  • Mache dich mit dem Programmiermodell und dem Ökosystem von Spark vertraut
  • Lerne allgemeine Ansätze in der Datenwissenschaft
  • Untersuche komplette Implementierungen, die große öffentliche Datensätze analysieren
  • Entdecken, welche Tools für maschinelles Lernen für bestimmte Probleme sinnvoll sind
  • Erforsche Code, der für viele Zwecke angepasst werden kann
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

Aufbau von Anwendungen mit maschinellem Lernen

Aufbau von Anwendungen mit maschinellem Lernen

Emmanuel Ameisen
Skalierung von Python mit Dask

Skalierung von Python mit Dask

Holden Karau, Mika Kimmins
Roboter mit ROS

Roboter mit ROS

Murat Calis
Aufbau von Pipelines für maschinelles Lernen

Aufbau von Pipelines für maschinelles Lernen

Hannes Hapke, Catherine Nelson

Publisher Resources

ISBN: 9781098190590