Book description
Dieses Buch ist ein umfassender Leitfaden f�¼r das Verst�¤ndnis von Datenanalyse am Arbeitsplatz. Alex Gutman und Jordan Goldmeier l�¼ften den Vorhang der Data Science und geben Ihnen die Sprache und die Werkzeuge an die Hand, die Sie ben�¶tigen, um informiert mitreden zu k�¶nnen, kritisch �¼ber die Auswertung von Daten zu sprechen und die richtigen Fragen zu stellen. Dank dieses Buchs kann jede:r ein Data Head werden und aktiv an Data Science, Statistik und Machine Learning teilnehmen - auch ohne einen technischen Background.
In diesem unterhaltsamen und gut verst�¤ndlichen Buch werden die aktuellen, zum Teil komplexen Data-Science- und Statistik-Konzepte anhand einfacher Beispiele und Analogien veranschaulicht. Sie lernen statistisches Denken, das Vermeiden h�¤ufiger Fallstricke bei der Interpretation von Daten, und Sie erfahren, was es mit Machine Learning, Textanalyse, Deep Learning und k�¼nstlicher Intelligenz wirklich auf sich hat. Wenn Sie in Ihrem Unternehmen konkret mit Daten arbeiten, F�¼hrungskraft oder angehender Data Scientist sind, zeigt Ihnen dieses Buch, wie Sie ein echter Data Head werden.
Table of contents
- Cover
- Titel
- Impressum
- Inhalt
- Widmung
- Vorwort
-
Einleitung
- Die Data-Science-Industrie
- Warum uns das Thema so wichtig ist
- Die Krise auf dem US-amerikanischen Subprime-Hypothekenmarkt
- Die US-Präsidentschaftswahl von 2016
- Unsere Hypothese
- Daten am Arbeitsplatz
- Die berühmte Sitzungssaal-Szene
- Sie können das große Ganze verstehen
- Restaurants klassifizieren
- Ja und?
- Für wen dieses Buch geschrieben wurde
- Warum wir dieses Buch geschrieben haben
- Was Sie lernen werden
- Wie dieses Buch strukturiert ist
- Ein letzter Punkt, bevor es wirklich losgeht
-
Teil I Denken wie ein Data Head
- 1 Was ist das Problem?
- Fragen, die ein Data Head stellen sollte
- Warum ist das Problem wichtig?
- Wen betrifft das Problem?
- Was ist, wenn wir nicht die richtigen Daten haben?
- Wann ist das Projekt zu Ende?
- Was tun wir, wenn uns die Ergebnisse nicht gefallen?
- Verstehen, warum Datenprojekte scheitern
- Szenario: Kundenwahrnehmung
- Diskussion
- An den wichtigen Problemen arbeiten
- Zusammenfassung
- 2 Was sind Daten?
- Daten oder Informationen?
- Ein Beispiel-Datensatz
- Datentypen
- Wie Daten gesammelt und strukturiert werden
- Beobachtungsbasierte versus experimentelle Daten
- Strukturierte versus unstrukturierte Daten
- Die Basics der zusammenfassenden Statistik
- Zusammenfassung
- 3 Vorbereitungen für das statistische Denken
- Stellen Sie Fragen!
- In allen Dingen ist Variation
- Szenario: Kundenwahrnehmung (die Fortsetzung)
- Fallstudie: Nierenkrebsraten
- Wahrscheinlichkeitsrechnung und Statistik
- Wahrscheinlichkeit oder Intuition
- Entdeckungen mit Statistiken
- Zusammenfassung
-
Teil II Sprechen wie ein Data Head
- 4 Daten infrage stellen
- Was würden Sie tun?
- Katastrophe durch fehlende Daten
- Erzählen Sie mir die Herkunftsgeschichte der Daten
- Wer hat die Daten gesammelt?
- Wie wurden die Daten gesammelt?
- Sind die Daten repräsentativ?
- Gibt es eine Stichprobenverzerrung?
- Wie wurde mit Ausreißern umgegangen?
- Welche Daten sehe ich nicht?
- Wie gehen Sie mit fehlenden Werten um?
- Können die Daten abbilden, was Sie mit ihnen messen wollen?
- Stellen Sie Daten infrage, egal wie groß die Datenmenge ist
- Zusammenfassung
- 5 Daten erkunden
- Ihre Rolle in der explorativen Datenanalyse
- Wie ein Forscher denken
- Leitfragen
- Der Versuchsaufbau
- Können die Daten Ihre Frage beantworten?
- Legen Sie Erwartungen fest und benutzen Sie Ihren gesunden Menschenverstand
- Ergeben die Werte intuitiv einen Sinn?
- Achtung: Ausreißer und fehlende Werte
- Sind Ihnen irgendwelche Beziehungen aufgefallen?
- Korrelation verstehen
- Achtung: Korrelation falsch interpretieren
- Achtung: Korrelation bedeutet nicht Kausalität
- Haben Sie in den Daten neue Einsatzmöglichkeiten oder unentdeckte Potenziale gefunden?
- Zusammenfassung
- 6 Wahrscheinlichkeiten untersuchen
- Raten Sie mal
- Die Spielregeln
- Schreibweise
- Bedingte Wahrscheinlichkeit und unabhängige Ereignisse
- Die Wahrscheinlichkeit mehrfacher Ereignisse
- Gedankenexperiment zur Wahrscheinlichkeit
- Die nächsten Schritte
- Seien Sie vorsichtig bei der Annahme von Abhängigkeiten
- Fallen Sie nicht auf den Spieler-Fehlschluss herein
- Alle Wahrscheinlichkeiten unterliegen bestimmten Bedingungen
- Vertauschen Sie Abhängigkeiten nicht
- Der Satz von Bayes
- Stellen Sie sicher, dass die Wahrscheinlichkeiten einen Sinn ergeben
- Kalibrierung
- Seltene Ereignisse können und werden eintreffen
- Zusammenfassung
- 7 Hinterfragen Sie Statistiken
- Kleine Einführung in die statistische Inferenz
- Schaffen Sie sich etwas Spielraum
- Mehr Daten, mehr Evidenz
- Hinterfragen Sie den Status quo
- Beweise für das Gegenteil (Evidenz)
- Entscheidungsfehler ausgleichen
- Die Vorgehensweise der statistischen Inferenz
- Die Fragen, die Sie stellen sollten, um Statistiken zu hinterfragen
- Was ist der Kontext für diese Statistik?
- Wie groß ist der Stichprobenumfang?
- Was testen Sie?
- Wie lautet die Nullhypothese?
- Wie hoch ist das Signifikanzniveau?
- Wie viele Tests führen Sie durch?
- Kann ich bitte die Konfidenzintervalle sehen?
- Ist dies von praktischer Bedeutung?
- Gehen Sie von einer Kausalität aus?
- Zusammenfassung
-
Teil III Den Werkzeugkasten des Data Scientist verstehen
- 8 Nach versteckten Gruppen suchen
- Unüberwachtes Lernen
- Dimensionsreduktion
- Zusammengefasste Features erstellen
- Hauptkomponentenanalyse
- Beispiel: HKA für die sportliche Leistungsfähigkeit
- Zusammenfassung zur HKA
- Mögliche Fallen
- Clustering
- Clustering mit dem k-Means-Algorithmus
- Beispiel: Clustering von Verkaufsfilialen
- Mögliche Fallen
- Zusammenfassung
- 9 Das Regressionsmodell verstehen
- Überwachtes Lernen
- Was macht die lineare Regression?
- Kleinste-Quadrate-Regression: mehr als nur ein hübscher Name
- Vorteile der linearen Regression
- Auf mehrere Features erweitern
- Probleme und Fallstricke der linearen Regression
- Unberücksichtigte Variablen
- Multikollinearität
- Data Leakage
- Extrapolationsfehler
- Viele Beziehungen sind nicht linear
- Erklärst du noch, oder machst du schon Vorhersagen?
- Leistungsfähigkeit der Regression
- Andere Regressionsmodelle
- Zusammenfassung
- 10 Das Klassifikationsmodell verstehen
- Einführung in die Klassifikation
- Was Sie lernen werden
- Klassifikationsproblem: Versuchsaufbau
- Logistische Regression
- Logistische Regression: Na und?
- Entscheidungsbäume
- Ensemblemethoden
- Zufallswälder
- Gradientenverstärkte Bäume
- Interpretierbarkeit von Ensemblemethoden
- Achten Sie auf Fallstricke
- Falsche Anwendung des Problems
- Data Leakage
- Keine Aufteilung der Daten
- Den richtigen Cut-off-Wert wählen
- Falsch verstandene Genauigkeit
- Konfusionsmatrizen
- Zusammenfassung
- 11 Textanalyse verstehen
- Erwartungen an die Textanalyse
- Wie aus Text Zahlen werden
- Ein großer Sack voll Wörter
- N-Gramme
- Worteinbettungen
- Topic Modeling
- Textklassifikation
- Naive Bayes
- Sentimentanalyse
- Praktische Überlegungen bei der Arbeit mit Text
- Die großen Technologiekonzerne haben die Oberhand
- Zusammenfassung
- 12 Konzepte des Deep Learning
- Neuronale Netzwerke
- Worin besteht die Ähnlichkeit zwischen neuronalen Netzwerken und dem Gehirn?
- Ein einfaches neuronales Netzwerk
- Wie ein neuronales Netzwerk lernt
- Ein etwas komplexeres neuronales Netzwerk
- Anwendungen des Deep Learning
- Die Vorteile des Deep Learning
- Wie Computer Bilder »sehen«
- Neuronale Konvolutionsnetze
- Deep Learning für Sprache und Wortsequenzen
- Deep Learning in der Praxis
- Haben Sie Daten?
- Sind Ihre Daten strukturiert?
- Wie wird das Netzwerk aussehen?
- Die künstliche Intelligenz und Sie
- Die großen Technologiekonzerne haben die Oberhand
- Ethik im Deep Learning
- Zusammenfassung
-
Teil IV Den Erfolg sichern
- 13 Achten Sie auf Fallstricke
- Bias und seltsame Datenphänomene
- Survivorship Bias
- Regression zur Mitte
- Das Simpson-Paradoxon
- Confirmation Bias
- Effort Bias
- Algorithmischer Bias
- Weitere Formen von Bias
- Die große Liste möglicher Fallstricke
- Fallstricke der Statistik und des Machine Learning
- Projektbezogene Fallstricke
- Zusammenfassung
- 14 Menschen und Persönlichkeiten kennen
- Sieben Szenarien typischer Kommunikationspannen
- Das Postmortem
- Märchenstunde
- Stille Post
- Verzettelt
- Der Realitätsabgleich
- Die Übernahme
- Der Angeber
- Datenpersönlichkeiten
- Datenenthusiasten
- Datenzyniker
- Data Heads
- Zusammenfassung
- 15 Was kommt danach?
- Danksagungen
- Fußnoten
- Index
- Über die Autoren
- Über den Fachgutachter und die Fachgutachterin
- Über den Übersetzer
Product information
- Title: Werde ein Data Head
- Author(s):
- Release date: April 2022
- Publisher(s): dpunkt
- ISBN: 9783960091912
You might also like
book
Statistics Done Wrong - Statistik richtig anwenden und gängige Fehler vermeiden -- Deutsche Ausgabe
Gängige Fehler vermeiden und Statistik richtig anwenden Daten sinnvoll auswerten – mit den geeigneten Methoden Die …
book
Data Science mit AWS
Mit diesem Buch lernen Machine-Learning- und KI-Praktiker, wie sie erfolgreich Data-Science-Projekte mit Amazon Web Services erstellen …
book
Machine Learning für Softwareentwickler
Das Buch richtet sich an Entwickler und Programmierer, die Konzepte und Programmierung des maschinellen Lernens von …
book
Netzwerke von Kopf bis Fuß
Frustriert von Bücher zu Netzwerkthemen, die nur so strotzen vor unverständlichen Abkürzungen? Netzwerke von Kopf bis …