Overview
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Dieses gründlich überarbeitete Handbuch zeigt, wie die Flexibilität der Kommandozeile dir helfen kann, ein effizienter und produktiver Datenwissenschaftler zu werden. Du lernst, wie du kleine, aber leistungsstarke Kommandozeilen-Tools kombinierst, um deine Daten schnell zu beschaffen, zu durchsuchen und zu modellieren. Für den Einstieg stellt dir der Autor Jeroen Janssens ein Docker-Image mit über 100 Unix-Power-Tools zur Verfügung - egal, ob du mit Windows, macOS oder Linux arbeitest.
Du wirst schnell entdecken, warum die Kommandozeile eine flexible, skalierbare und erweiterbare Technologie ist. Selbst wenn du mit Python oder R vertraut bist, wirst du lernen, wie du deinen Data Science-Workflow verbessern kannst, indem du die Möglichkeiten der Kommandozeile nutzt. Dieses Buch ist ideal für Data Scientists, Analysten, Ingenieure, Systemadministratoren und Forscher.
- Daten von Websites, APIs, Datenbanken und Tabellenkalkulationen abrufen
- Scrub-Operationen mit Text-, CSV-, HTML-, XML- und JSON-Dateien durchführen
- Daten zu untersuchen, beschreibende Statistiken zu berechnen und Visualisierungen zu erstellen
- Verwalte deinen Data Science Workflow
- Erstelle deine eigenen Tools aus Einzeilern und bestehendem Python- oder R-Code
- Parallelisiere und verteile datenintensive Pipelines
- Daten mit Algorithmen zur Dimensionalitätsreduktion, Regression und Klassifizierung modellieren
- Nutzen Sie die Kommandozeile von Python, Jupyter, R, RStudio und Apache Spark
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access