Kapitel 2. Erste Schritte
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
In diesem Kapitel stelle ich sicher, dass du alle Voraussetzungen erfüllst, um Data Science auf der Kommandozeile zu betreiben. Es gibt drei Voraussetzungen: (1) die gleichen Datensätze, die ich in diesem Buch verwende, (2) eine geeignete Umgebung mit allen Kommandozeilen-Tools, die ich in diesem Buch verwende, und (3) das Verständnis der wesentlichen Konzepte, die bei der Verwendung der Kommandozeile ins Spiel kommen.
Zuerst beschreibe ich, wie man die Datensätze herunterlädt. Dann erkläre ich, wie man das Docker-Image installiert, eine virtuelle Umgebung auf Basis von Ubuntu Linux, die alle notwendigen Kommandozeilen-Tools enthält. Schließlich gehe ich anhand von Beispielen auf die wichtigsten Unix-Konzepte ein.
Am Ende dieses Kapitels hast du alles, was du brauchst, um mit dem ersten Schritt der Datenwissenschaft fortzufahren, nämlich Daten zu beschaffen.
Die Daten erhalten
Die Datensätze, die ich in diesem Buch verwende, können wie folgt bezogen werden: :
-
Lade die ZIP-Datei von der Website des Buches herunter.
-
Erstelle ein neues Verzeichnis. Du kannst diesem Verzeichnis einen beliebigen Namen geben, aber ich empfehle dir, dich an Kleinbuchstaben, Zahlen und vielleicht einen Bindestrich oder einen Unterstrich zu halten, damit der Name in der Befehlszeile leichter zu handhaben ist - zum Beispiel dsatcl2. Erinnere ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access