Skip to Content
Datenwissenschaft an der Kommandozeile, 2.
book

Datenwissenschaft an der Kommandozeile, 2.

by Jeroen Janssens
October 2024
Intermediate to advanced
282 pages
6h 41m
German
O'Reilly Media, Inc.
Content preview from Datenwissenschaft an der Kommandozeile, 2.

Kapitel 3. Beschaffung von Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel geht es um den ersten Schritt des OSEMN-Modells: die Beschaffung von Daten. Denn ohne Daten können wir nicht viel Data Science betreiben. Ich gehe davon aus, dass die Daten, die du zur Lösung deines Data Science-Problems brauchst, bereits vorhanden sind. Deine erste Aufgabe besteht darin, diese Daten in einer Form auf deinen Computer (und möglicherweise auch in den Docker-Container) zu bekommen, mit der du arbeiten kannst.

Nach der Unix-Philosophie ist Text eine universelle Schnittstelle. Fast jedes Kommandozeilentool nimmt Text als Eingabe, produziert Text als Ausgabe oder beides. Das ist der Hauptgrund, warum Kommandozeilentools so gut zusammenarbeiten können. Aber wie wir noch sehen werden, kann auch nur Text in verschiedenen Formen vorliegen.

Daten können auf verschiedene Arten beschafft werden, z.B. durch Herunterladen von einem Server, durch Abfragen einer Datenbank oder durch eine Verbindung zu einer Web-API. Manchmal liegen die Daten in komprimierter Form oder in einem Binärformat vor, z.B. in einem Microsoft Excel Spreadsheet. In diesem Kapitel bespreche ich verschiedene Tools, die dabei helfen, dies von der Kommandozeile aus zu erledigen, z.B. curl,1 in2csv,2 sql2csv,3 und tar.4

Übersicht

In diesem Kapitel erfährst du, wie du..:

  • Lokale Dateien in das Docker-Image kopieren

  • Daten aus ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.

Read now

Unlock full access

More than 5,000 organizations count on O’Reilly

AirBnbBlueOriginElectronic ArtsHomeDepotNasdaqRakutenTata Consultancy Services

QuotationMarkO’Reilly covers everything we've got, with content to help us build a world-class technology community, upgrade the capabilities and competencies of our teams, and improve overall team performance as well as their engagement.
Julian F.
Head of Cybersecurity
QuotationMarkI wanted to learn C and C++, but it didn't click for me until I picked up an O'Reilly book. When I went on the O’Reilly platform, I was astonished to find all the books there, plus live events and sandboxes so you could play around with the technology.
Addison B.
Field Engineer
QuotationMarkI’ve been on the O’Reilly platform for more than eight years. I use a couple of learning platforms, but I'm on O'Reilly more than anybody else. When you're there, you start learning. I'm never disappointed.
Amir M.
Data Platform Tech Lead
QuotationMarkI'm always learning. So when I got on to O'Reilly, I was like a kid in a candy store. There are playlists. There are answers. There's on-demand training. It's worth its weight in gold, in terms of what it allows me to do.
Mark W.
Embedded Software Engineer

You might also like

API-Design, 2nd Edition

API-Design, 2nd Edition

Kai Spichale
The Human Factor in AI-Based Decision-Making

The Human Factor in AI-Based Decision-Making

Philip Meissner, Christoph Keding

Publisher Resources

ISBN: 9798341607576