O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

R für Data Science

Book Description

Lernen Sie, wie Sie mit R Ihre Rohdaten in Erkenntnisse und Wissen umwandeln. Dieses Buch führt Sie ein in R, RStudio und tidyverse – eine Sammlung von R-Paketen, die ineinandergreifen, um Data Science schnell, flüssig und komfortabel zu machen. R für Data Science ist geeignet für Leser ohne vorherige Programmierkenntnisse und zielt darauf ab, dass Sie Techniken der Data Science so schnell wie möglich in der Praxis umsetzen können.Die Autoren Hadley Wickham und Garrett Grolemund zeigen, wie Sie Daten importieren, aufbereiten, untersuchen und modellieren und wie Sie die Ergebnisse kommunizieren können. So bekommen Sie einen vollständigen Überblick über den Data-Science-Zyklus und die Tools, die für die Detailarbeit erforderlich sind.

Table of Contents

  1. Cover
  2. Titel
  3. Impressum
  4. Inhalt
  5. Vorwort
  6. Teil I Erkunden
    1. 1 Datenvisualisierung mit ggplot2
    2. Einführung
    3. Erste Schritte
    4. Zuordnungen visueller Eigenschaften
    5. Häufige Probleme
    6. Facetten
    7. Geometrische Objekte
    8. Statistische Transformationen
    9. Positionsanpassungen
    10. Koordinatensysteme
    11. Die »Layered Grammar of Graphics«
    12. 2 Workflow: Grundlagen
    13. Grundlagen der Codierung
    14. Was macht einen Namen aus?
    15. Funktionen aufrufen
    16. 3 Datentransformation mit dplyr
    17. Einführung
    18. Zeilen mit filter() filtern
    19. Zeilen mit arrange() anordnen
    20. Spalten mit select() auswählen
    21. Neue Variablen mit mutate() hinzufügen
    22. Gruppierte Zusammenfassungen mit summarize()
    23. Gruppierte Veränderungen (und Filter)
    24. 4 Workflow: Skripte
    25. Code ausführen
    26. RStudio-Fehlerdiagnose
    27. 5 Explorative Datenanalyse
    28. Einführung
    29. Fragen
    30. Variation
    31. Fehlende Werte
    32. Kovariation
    33. Muster und Modelle
    34. ggplot2-Aufrufe
    35. Mehr lernen
    36. 6 Workflow: Projekte
    37. Was ist real?
    38. Wo ist Ihre Analyse untergebracht?
    39. Pfade und Verzeichnisse
    40. RStudio-Projekte
    41. Zusammenfassung
  7. Teil II Aufbereiten
    1. 7 Tibbles mit tibble
    2. Einführung
    3. Tibbles erzeugen
    4. Tibbles versus data.frame
    5. Teilgruppen
    6. Mit älterem Code arbeiten
    7. 8 Datenimport mit readr
    8. Einführung
    9. Erste Schritte
    10. Einen Vektor parsen
    11. Eine Datei parsen
    12. In eine Datei schreiben
    13. Andere Datentypen
    14. 9 Daten aufbereiten mit tidyr
    15. Einführung
    16. Aufbereitete Daten
    17. Ausbreiten und Zusammenziehen
    18. Aufteilen und Vereinigen
    19. Fehlende Werte
    20. Fallstudie
    21. Unaufbereitete Daten
    22. 10 Relationale Daten mit dplyr
    23. Einführung
    24. nycflights13
    25. Schlüssel
    26. Verändernde Verknüpfungen
    27. Filternde Verknüpfungen
    28. Verknüpfungsprobleme
    29. Mengenoperationen
    30. 11 Strings mit stringr
    31. Einführung
    32. Grundlagen von Strings
    33. Musterübereinstimmung mit regulären Ausdrücken
    34. Tools
    35. Andere Mustertypen
    36. Andere Verwendungen von regulären Ausdrücken
    37. stringi
    38. 12 Faktoren mit forcats
    39. Einführung
    40. Faktoren erzeugen
    41. General Social Survey
    42. Faktorenreihenfolge ändern
    43. Faktorstufen modifizieren
    44. 13 Datum und Uhrzeit mit lubridate
    45. Einführung
    46. Datums-/Zeitwerte erzeugen
    47. Datums-/Zeitkomponenten
    48. Zeiträume
    49. Zeitzonen
  8. Teil III Programmieren
    1. 14 Pipes mit magrittr
    2. Einführung
    3. Alternativen zu Pipes
    4. Wann man Pipes nicht verwenden sollte
    5. Andere Tools von magrittr
    6. 15 Funktionen
    7. Einführung
    8. Wann sollte man eine Funktion schreiben?
    9. Funktionen – nützlich für Menschen und Computer
    10. Bedingte Ausführung
    11. Funktionsargumente
    12. Rückgabewerte
    13. Umgebung
    14. 16 Vektoren
    15. Einführung
    16. Grundlagen von Vektoren
    17. Wichtige Typen atomarer Vektoren
    18. Atomare Vektoren verwenden
    19. Rekursive Vektoren (Listen)
    20. Attribute
    21. Erweiterte Vektoren
    22. 17 Iteration mit purrr
    23. Einführung
    24. for-Schleifen
    25. Varianten von for-Schleifen
    26. Die map-Funktionen
    27. Fehlerverarbeitung
    28. Zuordnungen über mehrere Argumente
    29. Walk
    30. Andere Muster von for-Schleifen
  9. Teil IV Modellieren
    1. 18 Grundlagen der Modellierung mit modelr
    2. Einführung
    3. Ein einfaches Modell
    4. Modelle visualisieren
    5. Formel und Modellfamilien
    6. Fehlende Werte
    7. Andere Modellfamilien
    8. 19 Modelle erstellen
    9. Einführung
    10. Warum sind Diamanten geringer Qualität teurer als höherwertige?
    11. Was beeinflusst die Anzahl der täglichen Flüge?
    12. Mehr über Modelle lernen
    13. 20 Viele Modelle mit purrr und broom
    14. Einführung
    15. Gapminder
    16. Listenspalten
    17. Listenspalten erzeugen
    18. Listenspalten vereinfachen
    19. Daten bereinigen mit broom
  10. Teil V Kommunizieren
    1. 21 R Markdown
    2. Einführung
    3. R-Markdown-Grundlagen
    4. Textformatierung mit Markdown
    5. Codebereiche
    6. Fehlerbehebung
    7. YAML-Header
    8. Mehr lernen
    9. 22 Grafik für Kommunikation mit ggplot2
    10. Einführung
    11. Beschriftungen
    12. Anmerkungen
    13. Skalen
    14. Zoomen
    15. Themen
    16. Diagramme speichern
    17. Mehr lernen
    18. 23 R-Markdown-Formate
    19. Einführung
    20. Ausgabeoptionen
    21. Dokumente
    22. Notebooks
    23. Präsentationen
    24. Dashboards
    25. Interaktivität
    26. Websites
    27. Andere Formate
    28. Mehr lernen
    29. 24 R-Markdown-Workflow
  11. Index
  12. Über die Autoren
  13. Kolophon
  14. Fußnoten