Kapitel 10. Polyglotte Datenwissenschaft

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Ein Polyglott ist jemand, der mehrere Sprachen spricht. Für mich ( ) ist ein polyglotter Datenwissenschaftler jemand, der mehrere Programmiersprachen, Tools und Techniken verwendet, um Daten zu erhalten, zu untersuchen und zu modellieren.

Die Kommandozeile fördert einen polyglotten Ansatz. Der Kommandozeile ist es egal, in welcher Programmiersprache ein Tool geschrieben ist, solange es der Unix-Philosophie folgt. Das haben wir in Kapitel 4 sehr deutlich gesehen, als wir Kommandozeilen-Tools in Bash, Python und R erstellt haben. Außerdem haben wir SQL-Abfragen direkt auf CSV-Dateien ausgeführt und R-Ausdrücke von der Kommandozeile aus ausgeführt. Kurz gesagt, wir haben bereits polyglotte Datenwissenschaft betrieben, ohne uns dessen bewusst zu sein!

In diesem Kapitel gehe ich noch einen Schritt weiter und drehe den Spieß um: Ich zeige dir, wie du die Kommandozeile in verschiedenen Programmiersprachen und -umgebungen nutzen kannst. Denn seien wir ehrlich: Wir werden nicht unsere gesamte Data-Science-Karriere an der Kommandozeile verbringen. Wenn ich Daten analysiere, verwende ich oft die integrierte Entwicklungsumgebung (IDE) RStudio, und wenn ich etwas implementiere, verwende ich oft Python. Ich verwende alles, was mir hilft, meine Arbeit zu erledigen.

Ich finde es beruhigend zu wissen, dass die Kommandozeile ...

Get Datenwissenschaft an der Kommandozeile, 2. now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.