Book description
Lernen Sie, wie Sie mit R Ihre Rohdaten in Erkenntnisse und Wissen umwandeln. Dieses Buch führt Sie ein in R, RStudio und tidyverse – eine Sammlung von R-Paketen, die ineinandergreifen, um Data Science schnell, flüssig und komfortabel zu machen. R für Data Science ist geeignet für Leser ohne vorherige Programmierkenntnisse und zielt darauf ab, dass Sie Techniken der Data Science so schnell wie möglich in der Praxis umsetzen können.Die Autoren Hadley Wickham und Garrett Grolemund zeigen, wie Sie Daten importieren, aufbereiten, untersuchen und modellieren und wie Sie die Ergebnisse kommunizieren können. So bekommen Sie einen vollständigen Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind.
Table of contents
- Cover
- Titel
- Impressum
- Inhalt
- Vorwort
-
Teil I Erkunden
- 1 Datenvisualisierung mit ggplot2
- Einführung
- Erste Schritte
- Zuordnungen visueller Eigenschaften
- Häufige Probleme
- Facetten
- Geometrische Objekte
- Statistische Transformationen
- Positionsanpassungen
- Koordinatensysteme
- Die »Layered Grammar of Graphics«
- 2 Workflow: Grundlagen
- Grundlagen der Codierung
- Was macht einen Namen aus?
- Funktionen aufrufen
- 3 Datentransformation mit dplyr
- Einführung
- Zeilen mit filter() filtern
- Zeilen mit arrange() anordnen
- Spalten mit select() auswählen
- Neue Variablen mit mutate() hinzufügen
- Gruppierte Zusammenfassungen mit summarize()
- Gruppierte Veränderungen (und Filter)
- 4 Workflow: Skripte
- Code ausführen
- RStudio-Fehlerdiagnose
- 5 Explorative Datenanalyse
- Einführung
- Fragen
- Variation
- Fehlende Werte
- Kovariation
- Muster und Modelle
- ggplot2-Aufrufe
- Mehr lernen
- 6 Workflow: Projekte
- Was ist real?
- Wo ist Ihre Analyse untergebracht?
- Pfade und Verzeichnisse
- RStudio-Projekte
- Zusammenfassung
-
Teil II Aufbereiten
- 7 Tibbles mit tibble
- Einführung
- Tibbles erzeugen
- Tibbles versus data.frame
- Teilgruppen
- Mit älterem Code arbeiten
- 8 Datenimport mit readr
- Einführung
- Erste Schritte
- Einen Vektor parsen
- Eine Datei parsen
- In eine Datei schreiben
- Andere Datentypen
- 9 Daten aufbereiten mit tidyr
- Einführung
- Aufbereitete Daten
- Ausbreiten und Zusammenziehen
- Aufteilen und Vereinigen
- Fehlende Werte
- Fallstudie
- Unaufbereitete Daten
- 10 Relationale Daten mit dplyr
- Einführung
- nycflights13
- Schlüssel
- Verändernde Verknüpfungen
- Filternde Verknüpfungen
- Verknüpfungsprobleme
- Mengenoperationen
- 11 Strings mit stringr
- Einführung
- Grundlagen von Strings
- Musterübereinstimmung mit regulären Ausdrücken
- Tools
- Andere Mustertypen
- Andere Verwendungen von regulären Ausdrücken
- stringi
- 12 Faktoren mit forcats
- Einführung
- Faktoren erzeugen
- General Social Survey
- Faktorenreihenfolge ändern
- Faktorstufen modifizieren
- 13 Datum und Uhrzeit mit lubridate
- Einführung
- Datums-/Zeitwerte erzeugen
- Datums-/Zeitkomponenten
- Zeiträume
- Zeitzonen
-
Teil III Programmieren
- 14 Pipes mit magrittr
- Einführung
- Alternativen zu Pipes
- Wann man Pipes nicht verwenden sollte
- Andere Tools von magrittr
- 15 Funktionen
- Einführung
- Wann sollte man eine Funktion schreiben?
- Funktionen – nützlich für Menschen und Computer
- Bedingte Ausführung
- Funktionsargumente
- Rückgabewerte
- Umgebung
- 16 Vektoren
- Einführung
- Grundlagen von Vektoren
- Wichtige Typen atomarer Vektoren
- Atomare Vektoren verwenden
- Rekursive Vektoren (Listen)
- Attribute
- Erweiterte Vektoren
- 17 Iteration mit purrr
- Einführung
- for-Schleifen
- Varianten von for-Schleifen
- Die map-Funktionen
- Fehlerverarbeitung
- Zuordnungen über mehrere Argumente
- Walk
- Andere Muster von for-Schleifen
-
Teil IV Modellieren
- 18 Grundlagen der Modellierung mit modelr
- Einführung
- Ein einfaches Modell
- Modelle visualisieren
- Formel und Modellfamilien
- Fehlende Werte
- Andere Modellfamilien
- 19 Modelle erstellen
- Einführung
- Warum sind Diamanten geringer Qualität teurer als höherwertige?
- Was beeinflusst die Anzahl der täglichen Flüge?
- Mehr über Modelle lernen
- 20 Viele Modelle mit purrr und broom
- Einführung
- Gapminder
- Listenspalten
- Listenspalten erzeugen
- Listenspalten vereinfachen
- Daten bereinigen mit broom
-
Teil V Kommunizieren
- 21 R Markdown
- Einführung
- R-Markdown-Grundlagen
- Textformatierung mit Markdown
- Codebereiche
- Fehlerbehebung
- YAML-Header
- Mehr lernen
- 22 Grafik für Kommunikation mit ggplot2
- Einführung
- Beschriftungen
- Anmerkungen
- Skalen
- Zoomen
- Themen
- Diagramme speichern
- Mehr lernen
- 23 R-Markdown-Formate
- Einführung
- Ausgabeoptionen
- Dokumente
- Notebooks
- Präsentationen
- Dashboards
- Interaktivität
- Websites
- Andere Formate
- Mehr lernen
- 24 R-Markdown-Workflow
- Index
- Über die Autoren
- Kolophon
- Fußnoten
Product information
- Title: R für Data Science
- Author(s):
- Release date: November 2017
- Publisher(s): dpunkt
- ISBN: 9783960090502
You might also like
book
Praktische Statistik für Data Scientists, 2nd Edition
Statistische Methoden sind ein zentraler Bestandteil der Arbeit mit Daten, doch nur wenige Data Scientists haben …
book
Einführung in Data Science, 2nd Edition
Dieses Buch führt Sie in Data Science ein, indem es grundlegende Prinzipien der Datenanalyse erläutert und …
book
Machine Learning Kochbuch
Python-Programmierer finden in diesem Kochbuch nahezu 200 wertvolle und jeweils in sich abgeschlossene Anleitungen zu Aufgabenstellungen …
book
Mathe-Basics für Data Scientists
Um als Data Scientist erfolgreich zu sein, müssen Sie über ein solides mathematisches Grundwissen verfügen. Dieses …