Kapitel 2. Erste Schritte

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In diesem Kapitel stelle ich sicher, dass du alle Voraussetzungen erfüllst, um Data Science auf der Kommandozeile zu betreiben. Es gibt drei Voraussetzungen: (1) die gleichen Datensätze, die ich in diesem Buch verwende, (2) eine geeignete Umgebung mit allen Kommandozeilen-Tools, die ich in diesem Buch verwende, und (3) das Verständnis der wesentlichen Konzepte, die bei der Verwendung der Kommandozeile ins Spiel kommen.

Zuerst beschreibe ich, wie man die Datensätze herunterlädt. Dann erkläre ich, wie man das Docker-Image installiert, eine virtuelle Umgebung auf Basis von Ubuntu Linux, die alle notwendigen Kommandozeilen-Tools enthält. Schließlich gehe ich anhand von Beispielen auf die wichtigsten Unix-Konzepte ein.

Am Ende dieses Kapitels hast du alles, was du brauchst, um mit dem ersten Schritt der Datenwissenschaft fortzufahren, nämlich Daten zu beschaffen.

Die Daten erhalten

Die Datensätze, die ich in diesem Buch verwende, können wie folgt bezogen werden: :

  1. Lade die ZIP-Datei von der Website des Buches herunter.

  2. Erstelle ein neues Verzeichnis. Du kannst diesem Verzeichnis einen beliebigen Namen geben, aber ich empfehle dir, dich an Kleinbuchstaben, Zahlen und vielleicht einen Bindestrich oder einen Unterstrich zu halten, damit der Name in der Befehlszeile leichter zu handhaben ist - zum Beispiel dsatcl2. Erinnere ...

Get Datenwissenschaft an der Kommandozeile, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.