Werde ein Data Head

Book description

Dieses Buch ist ein umfassender Leitfaden f�¼r das Verst�¤ndnis von Datenanalyse am Arbeitsplatz. Alex Gutman und Jordan Goldmeier l�¼ften den Vorhang der Data Science und geben Ihnen die Sprache und die Werkzeuge an die Hand, die Sie ben�¶tigen, um informiert mitreden zu k�¶nnen, kritisch �¼ber die Auswertung von Daten zu sprechen und die richtigen Fragen zu stellen. Dank dieses Buchs kann jede:r ein Data Head werden und aktiv an Data Science, Statistik und Machine Learning teilnehmen - auch ohne einen technischen Background.

In diesem unterhaltsamen und gut verst�¤ndlichen Buch werden die aktuellen, zum Teil komplexen Data-Science- und Statistik-Konzepte anhand einfacher Beispiele und Analogien veranschaulicht. Sie lernen statistisches Denken, das Vermeiden h�¤ufiger Fallstricke bei der Interpretation von Daten, und Sie erfahren, was es mit Machine Learning, Textanalyse, Deep Learning und k�¼nstlicher Intelligenz wirklich auf sich hat. Wenn Sie in Ihrem Unternehmen konkret mit Daten arbeiten, F�¼hrungskraft oder angehender Data Scientist sind, zeigt Ihnen dieses Buch, wie Sie ein echter Data Head werden.

Table of contents

  1. Cover
  2. Titel
  3. Impressum
  4. Inhalt
  5. Widmung
  6. Vorwort
  7. Einleitung
    1. Die Data-Science-Industrie
    2. Warum uns das Thema so wichtig ist
    3. Die Krise auf dem US-amerikanischen Subprime-Hypothekenmarkt
    4. Die US-Präsidentschaftswahl von 2016
    5. Unsere Hypothese
    6. Daten am Arbeitsplatz
    7. Die berühmte Sitzungssaal-Szene
    8. Sie können das große Ganze verstehen
    9. Restaurants klassifizieren
    10. Ja und?
    11. Für wen dieses Buch geschrieben wurde
    12. Warum wir dieses Buch geschrieben haben
    13. Was Sie lernen werden
    14. Wie dieses Buch strukturiert ist
    15. Ein letzter Punkt, bevor es wirklich losgeht
  8. Teil I Denken wie ein Data Head
    1. 1 Was ist das Problem?
    2. Fragen, die ein Data Head stellen sollte
    3. Warum ist das Problem wichtig?
    4. Wen betrifft das Problem?
    5. Was ist, wenn wir nicht die richtigen Daten haben?
    6. Wann ist das Projekt zu Ende?
    7. Was tun wir, wenn uns die Ergebnisse nicht gefallen?
    8. Verstehen, warum Datenprojekte scheitern
    9. Szenario: Kundenwahrnehmung
    10. Diskussion
    11. An den wichtigen Problemen arbeiten
    12. Zusammenfassung
    13. 2 Was sind Daten?
    14. Daten oder Informationen?
    15. Ein Beispiel-Datensatz
    16. Datentypen
    17. Wie Daten gesammelt und strukturiert werden
    18. Beobachtungsbasierte versus experimentelle Daten
    19. Strukturierte versus unstrukturierte Daten
    20. Die Basics der zusammenfassenden Statistik
    21. Zusammenfassung
    22. 3 Vorbereitungen für das statistische Denken
    23. Stellen Sie Fragen!
    24. In allen Dingen ist Variation
    25. Szenario: Kundenwahrnehmung (die Fortsetzung)
    26. Fallstudie: Nierenkrebsraten
    27. Wahrscheinlichkeitsrechnung und Statistik
    28. Wahrscheinlichkeit oder Intuition
    29. Entdeckungen mit Statistiken
    30. Zusammenfassung
  9. Teil II Sprechen wie ein Data Head
    1. 4 Daten infrage stellen
    2. Was würden Sie tun?
    3. Katastrophe durch fehlende Daten
    4. Erzählen Sie mir die Herkunftsgeschichte der Daten
    5. Wer hat die Daten gesammelt?
    6. Wie wurden die Daten gesammelt?
    7. Sind die Daten repräsentativ?
    8. Gibt es eine Stichprobenverzerrung?
    9. Wie wurde mit Ausreißern umgegangen?
    10. Welche Daten sehe ich nicht?
    11. Wie gehen Sie mit fehlenden Werten um?
    12. Können die Daten abbilden, was Sie mit ihnen messen wollen?
    13. Stellen Sie Daten infrage, egal wie groß die Datenmenge ist
    14. Zusammenfassung
    15. 5 Daten erkunden
    16. Ihre Rolle in der explorativen Datenanalyse
    17. Wie ein Forscher denken
    18. Leitfragen
    19. Der Versuchsaufbau
    20. Können die Daten Ihre Frage beantworten?
    21. Legen Sie Erwartungen fest und benutzen Sie Ihren gesunden Menschenverstand
    22. Ergeben die Werte intuitiv einen Sinn?
    23. Achtung: Ausreißer und fehlende Werte
    24. Sind Ihnen irgendwelche Beziehungen aufgefallen?
    25. Korrelation verstehen
    26. Achtung: Korrelation falsch interpretieren
    27. Achtung: Korrelation bedeutet nicht Kausalität
    28. Haben Sie in den Daten neue Einsatzmöglichkeiten oder unentdeckte Potenziale gefunden?
    29. Zusammenfassung
    30. 6 Wahrscheinlichkeiten untersuchen
    31. Raten Sie mal
    32. Die Spielregeln
    33. Schreibweise
    34. Bedingte Wahrscheinlichkeit und unabhängige Ereignisse
    35. Die Wahrscheinlichkeit mehrfacher Ereignisse
    36. Gedankenexperiment zur Wahrscheinlichkeit
    37. Die nächsten Schritte
    38. Seien Sie vorsichtig bei der Annahme von Abhängigkeiten
    39. Fallen Sie nicht auf den Spieler-Fehlschluss herein
    40. Alle Wahrscheinlichkeiten unterliegen bestimmten Bedingungen
    41. Vertauschen Sie Abhängigkeiten nicht
    42. Der Satz von Bayes
    43. Stellen Sie sicher, dass die Wahrscheinlichkeiten einen Sinn ergeben
    44. Kalibrierung
    45. Seltene Ereignisse können und werden eintreffen
    46. Zusammenfassung
    47. 7 Hinterfragen Sie Statistiken
    48. Kleine Einführung in die statistische Inferenz
    49. Schaffen Sie sich etwas Spielraum
    50. Mehr Daten, mehr Evidenz
    51. Hinterfragen Sie den Status quo
    52. Beweise für das Gegenteil (Evidenz)
    53. Entscheidungsfehler ausgleichen
    54. Die Vorgehensweise der statistischen Inferenz
    55. Die Fragen, die Sie stellen sollten, um Statistiken zu hinterfragen
    56. Was ist der Kontext für diese Statistik?
    57. Wie groß ist der Stichprobenumfang?
    58. Was testen Sie?
    59. Wie lautet die Nullhypothese?
    60. Wie hoch ist das Signifikanzniveau?
    61. Wie viele Tests führen Sie durch?
    62. Kann ich bitte die Konfidenzintervalle sehen?
    63. Ist dies von praktischer Bedeutung?
    64. Gehen Sie von einer Kausalität aus?
    65. Zusammenfassung
  10. Teil III Den Werkzeugkasten des Data Scientist verstehen
    1. 8 Nach versteckten Gruppen suchen
    2. Unüberwachtes Lernen
    3. Dimensionsreduktion
    4. Zusammengefasste Features erstellen
    5. Hauptkomponentenanalyse
    6. Beispiel: HKA für die sportliche Leistungsfähigkeit
    7. Zusammenfassung zur HKA
    8. Mögliche Fallen
    9. Clustering
    10. Clustering mit dem k-Means-Algorithmus
    11. Beispiel: Clustering von Verkaufsfilialen
    12. Mögliche Fallen
    13. Zusammenfassung
    14. 9 Das Regressionsmodell verstehen
    15. Überwachtes Lernen
    16. Was macht die lineare Regression?
    17. Kleinste-Quadrate-Regression: mehr als nur ein hübscher Name
    18. Vorteile der linearen Regression
    19. Auf mehrere Features erweitern
    20. Probleme und Fallstricke der linearen Regression
    21. Unberücksichtigte Variablen
    22. Multikollinearität
    23. Data Leakage
    24. Extrapolationsfehler
    25. Viele Beziehungen sind nicht linear
    26. Erklärst du noch, oder machst du schon Vorhersagen?
    27. Leistungsfähigkeit der Regression
    28. Andere Regressionsmodelle
    29. Zusammenfassung
    30. 10 Das Klassifikationsmodell verstehen
    31. Einführung in die Klassifikation
    32. Was Sie lernen werden
    33. Klassifikationsproblem: Versuchsaufbau
    34. Logistische Regression
    35. Logistische Regression: Na und?
    36. Entscheidungsbäume
    37. Ensemblemethoden
    38. Zufallswälder
    39. Gradientenverstärkte Bäume
    40. Interpretierbarkeit von Ensemblemethoden
    41. Achten Sie auf Fallstricke
    42. Falsche Anwendung des Problems
    43. Data Leakage
    44. Keine Aufteilung der Daten
    45. Den richtigen Cut-off-Wert wählen
    46. Falsch verstandene Genauigkeit
    47. Konfusionsmatrizen
    48. Zusammenfassung
    49. 11 Textanalyse verstehen
    50. Erwartungen an die Textanalyse
    51. Wie aus Text Zahlen werden
    52. Ein großer Sack voll Wörter
    53. N-Gramme
    54. Worteinbettungen
    55. Topic Modeling
    56. Textklassifikation
    57. Naive Bayes
    58. Sentimentanalyse
    59. Praktische Überlegungen bei der Arbeit mit Text
    60. Die großen Technologiekonzerne haben die Oberhand
    61. Zusammenfassung
    62. 12 Konzepte des Deep Learning
    63. Neuronale Netzwerke
    64. Worin besteht die Ähnlichkeit zwischen neuronalen Netzwerken und dem Gehirn?
    65. Ein einfaches neuronales Netzwerk
    66. Wie ein neuronales Netzwerk lernt
    67. Ein etwas komplexeres neuronales Netzwerk
    68. Anwendungen des Deep Learning
    69. Die Vorteile des Deep Learning
    70. Wie Computer Bilder »sehen«
    71. Neuronale Konvolutionsnetze
    72. Deep Learning für Sprache und Wortsequenzen
    73. Deep Learning in der Praxis
    74. Haben Sie Daten?
    75. Sind Ihre Daten strukturiert?
    76. Wie wird das Netzwerk aussehen?
    77. Die künstliche Intelligenz und Sie
    78. Die großen Technologiekonzerne haben die Oberhand
    79. Ethik im Deep Learning
    80. Zusammenfassung
  11. Teil IV Den Erfolg sichern
    1. 13 Achten Sie auf Fallstricke
    2. Bias und seltsame Datenphänomene
    3. Survivorship Bias
    4. Regression zur Mitte
    5. Das Simpson-Paradoxon
    6. Confirmation Bias
    7. Effort Bias
    8. Algorithmischer Bias
    9. Weitere Formen von Bias
    10. Die große Liste möglicher Fallstricke
    11. Fallstricke der Statistik und des Machine Learning
    12. Projektbezogene Fallstricke
    13. Zusammenfassung
    14. 14 Menschen und Persönlichkeiten kennen
    15. Sieben Szenarien typischer Kommunikationspannen
    16. Das Postmortem
    17. Märchenstunde
    18. Stille Post
    19. Verzettelt
    20. Der Realitätsabgleich
    21. Die Übernahme
    22. Der Angeber
    23. Datenpersönlichkeiten
    24. Datenenthusiasten
    25. Datenzyniker
    26. Data Heads
    27. Zusammenfassung
    28. 15 Was kommt danach?
  12. Danksagungen
  13. Fußnoten
  14. Index
  15. Über die Autoren
  16. Über den Fachgutachter und die Fachgutachterin
  17. Über den Übersetzer

Product information

  • Title: Werde ein Data Head
  • Author(s): Alex J. Gutman, Jordan Goldmeier
  • Release date: April 2022
  • Publisher(s): dpunkt
  • ISBN: 9783960091912