O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Datenanalyse von Kopf bis Fuß

Book Description

Natürlich kann man Geschäftsentscheidungen aus unternehmerischem Instinkt treffen. In der Regel ist es aber doch sehr empfehlenswert, das Bauchgefühl mit objektivierbaren Fakten zu unterfüttern.

Dazu müssen Sie als erstes Daten erheben, eventuell Umfragen durchführen oder geeignetes bestehendes Zahlenmaterial sammeln. Dann geht es an die eigentliche Analyse: Welche Muster lassen sich erkennen, was ist aussagekräftig und was nur weißes Rauschen, welche Schlüsse lassen sich ziehen, und ist vielleicht sogar eine Zukunftsprognose möglich? Sie erfahren in "Datenanalyse von Kopf bis Fuß", mit welchen Werkzeugen Sie diese Analysen durchführen können, wo die Gefahren falscher Schlussfolgerungen lauern und wie Sie Ihre Ergebnisse für andere visuell aufbereiten können.

Table of Contents

  1. Datenanalyse von Kopf bis Fuß
  2. Der Autor von Datenanalyse von Kopf bis Fuß
  3. Der Übersetzer dieses Buchs
    1. Verwandte Titel von O’Reilly
    2. Weitere Bücher aus O’Reillys Reihe Von Kopf bis Fuß
  4. Wie man dieses Buch benutzt: Einführung
    1. Für wen ist dieses Buch?
      1. Wer sollte eher die Finger von diesem Buch lassen?
    2. Wir wissen, was Sie gerade denken
    3. Und wir wissen, was Ihr Gehirn gerade denkt.
    4. Metakognition: Nachdenken übers Denken
    5. Das haben WIR getan
    6. Und das können SIE tun, um sich Ihr Gehirn gefügig zu machen
    7. Lies mich!
    8. Die Gutachter
    9. Danksagungen
  5. 1. Einführung in die Datenanalyse: Wir zerlegen alles in seine Einzelteile
    1. Überall sind Daten
    2. René Sans Kosmetik braucht Ihre Hilfe
    3. Der Geschäftsführer würde den Absatz gern mit einer Datenanalyse anschieben
    4. Datenanalyse heißt, sorgfältig über die Befundlage nachzudenken
    5. Definieren Sie das Problem
    6. Ihr Auftraggeber hilft Ihnen, das Problem zu definieren
    7. Es gibt keine: Dummen Fragen
    8. Feedback von René Sans für Sie
    9. Brechen Sie Problemstellung und Daten in besser überschaubare Teile auf
      1. Zerlegen Sie das Problem in kleinere Teilprobleme
      2. Teilen Sie die Daten in kleinere Blöcke auf
    10. Sehen Sie sich ein weiteres Mal an, was Sie haben
    11. Werten Sie die Teilprobleme aus
    12. Eine Analyse haben Sie erst, wenn Sie sich selbst einbringen
    13. Geben Sie eine Empfehlung
    14. Ihr Bericht ist fertig
    15. Der Geschäftsführer mag Ihre Arbeit
      1. Ihr Bericht ist knapp, professionell und direkt
    16. Gerade erhalten wir Nachricht von einem Zeitungsartikel
    17. Sie haben sich von den Einschätzungen des Geschäftsführers in die falsche Richtung schicken lassen
    18. Ihre Annahmen und Meinungen zur Realität sind Ihr mentales Modell
    19. Ihr statistisches Modell hängt von Ihrem mentalen Modell ab
    20. Mentale Modelle sollten immer das einschließen, was Sie nicht wissen
    21. Der Geschäftsführer informiert Sie darüber, was er nicht weiß
    22. Es gibt keine: Dummen Fragen
    23. René Sans hat Ihnen gerade eine Riesenliste mit Rohdaten zugeschickt
    24. Zeit, die Daten weiter aufzubohren
    25. Der Großhändler Alles für Alle bestätigt Ihnen Ihren Eindruck
    26. Es gibt keine: Dummen Fragen
    27. So sind Sie vorgegangen
    28. Ihre Analyse hat Ihrem Auftraggeber zu einer brillanten Entscheidung verholfen
  6. 2. Experimente: Überprüfen Sie Ihre Hypothesen
    1. Können Sie belegen, was Sie glauben?
    2. Kaffee-Rezession!
    3. Nächste Vorstandssitzung bei Sternback in drei Monaten
    4. Der Sternback-Fragebogen
    5. Immer die Methode des Vergleichs benutzen
    6. Vergleiche sind das A und O im Umgang mit Beobachtungsdaten
    7. Könnte das Wertempfinden den Ertragsrückgang verursacht haben?
    8. Es gibt keine: Dummen Fragen
    9. Denkweise eines typischen Kunden
    10. Beobachtungsstudien sind voll von Störvariablen
    11. Mögliche Konfundierung der Ergebnisse durch die Standortfrage
    12. Es gibt keine: Dummen Fragen
    13. Bändigen Sie konfundierende Variablen durch Aufteilung der Daten in Blöcke
    14. Es ist schlimmer, als wir dachten!
    15. Sie müssen ein Experiment durchführen, um die beste Strategie herauszufinden
    16. Der Sternback-Geschäftsführer hat es ziemlich eilig
    17. Sternback senkt die Preise
    18. Einen Monat später ...
    19. Eine Kontrollgruppe verschafft Ihnen eine Baseline
    20. Es gibt keine: Dummen Fragen
    21. Wie man nicht gefeuert wird (oder: Notruf 112)
    22. Machen wir mal ein richtiges! Experiment
    23. Einen Monat später ...
    24. Auch Experimente werden von Störvariablen geplagt
    25. Konfundierung durch sorgfältige Gruppenbildung vermeiden
    26. Durch Randomisierung homogene Gruppen zusammenstellen
    27. Ihr Experiment kann starten
    28. Die Ergebnisse sind da
    29. Sternback verfügt jetzt über eine empirisch überprüfte Verkaufsstrategie
  7. 3. Optimierung: Holen Sie das Äußerste raus
    1. Wir wollen immer so viel wie möglich
    2. Diesmal haben Sie es mit Badetieren zu tun
    3. Die kontrollierten Variablen werden durch Nebenbedingungen beschränkt
    4. Die Entscheidungsvariablen sind das, was Sie kontrollieren können
    5. Sie haben ein Optimierungsproblem
    6. Die Zielvorgabe bestimmen Sie mit der Zielfunktion
    7. Ihre Zielfunktion
    8. Produktmixe für weitere Nebenbedingungen
    9. Zeichnen Sie mehrere Nebenbedingungen in dasselbe Diagramm
    10. Ihre Wahlmöglichkeiten liegen ausschließlich im zulässigen Bereich
    11. Ihre neue Nebenbedingung hat den zulässigen Bereich verändert
    12. Ihre Tabellenkalkulation kann optimieren
    13. Der Solver erledigt Ihr Optimierungsproblem im Handumdrehen
    14. Der Profit geht in den Keller
    15. Ihr Modell beschreibt nur, was Sie darin aufnehmen
    16. Gleichen Sie Ihre Modellannahmen mit den Zielvorgaben Ihrer Analyse ab
    17. Es gibt keine: Dummen Fragen
    18. Achten Sie auf negativ gekoppelte Variablen
    19. Ihr neuer Fertigungsplan funktioniert reibungslos
    20. Ihre Annahmen beruhen auf einer sich permanent im Fluss befindlichen Realität
  8. 4. Datenvisualisierung: Aus Bildern lernen Sie was
    1. Sie brauchen mehr als eine Tabelle voller Zahlen
    2. Bei Anziehend anders möchte man die Website optimieren
    3. Die Ergebnisse sind drin, und der Informationsgestalter ist raus
    4. Der letzte Informationsgestalter hat diese drei Infografiken eingereicht
    5. Welche Daten stehen hinter den Grafiken?
    6. Wo sind die Daten?!
    7. Ein paar Gratisratschläge vom vorigen Informationsgestalter
    8. Zu viele Daten sind nie Teil Ihres Problems
    9. Daten hübsch aussehen zu lassen, ist ebenfalls nicht Ihr Problem
    10. Auch bei der Datenvisualisierung geht es immer um die richtigen Vergleiche
    11. Ihre Grafik ist jetzt schon nützlicher als die zurückgewiesenen
    12. Nehmen Sie Streudiagramme, wenn Sie Zusammenhänge erforschen
    13. Die besten Diagramme sind multivariat
    14. Stellen Sie mehr Variablen dar, indem Sie mehrere Diagramme gemeinsam anzeigen
    15. Es gibt keine: Dummen Fragen
    16. Das Diagramm ist hervorragend, der Web-Crack ist aber noch nicht zufrieden
    17. Eine gute visuelle Umsetzung hilft Ihnen, über Ursachen nachzudenken
    18. Die Versuchsplaner schalten sich ein
    19. Die Versuchsplaner haben ihre eigenen Hypothesen
    20. Ihr Auftraggeber ist zufrieden mit Ihrer Arbeit
    21. Von überall her laufen Bestellungen ein!
  9. 5. Hypothesen prüfen: Sag, dass das nicht wahr ist
    1. Es kann ganz schön schwierig sein, die Realität zu erfassen
    2. Ich brauch was zum Anziehen ...
    3. Wann soll die Produktion der neuen Handyskins starten?
    4. PodPhone möchte nicht, dass man voraussehen kann, was sie als Nächstes tun
    5. Das ist alles, was wir wissen
    6. Die Hypothese von Skinner passt zu den Daten
    7. Skinner ist in den Besitz eines vertraulichen Strategiepapiers gelangtngt
    8. Variablen können positiv oder negativ gekoppelt sein
    9. Zusammenhänge sind in der Realität nicht linear, sondern vernetzt
    10. Hypothesen zu den Optionen bei PodPhone
    11. Sie haben alles, was Sie zur Überprüfung der Hypothesen brauchen
    12. Falsifikation – das A und O beim Prüfen von Hypothesen
    13. Es gibt keine: Dummen Fragen
    14. Diagnostizität hilft, die Hypothese mit den wenigsten Gegenargumenten zu finden
    15. Nicht jede Hypothese lässt sich ausschließen, Sie können aber festlegen, welche stärker ist als die anderen
    16. Sie haben gerade eine Bildnachricht bekommen ...
    17. Es ist raus!
  10. 6. Bayes-Statistik: Bloß nicht die Bodenhaftung verlieren!
    1. Sie erfassen ständig neue Daten
    2. Schlechte Nachrichten von Ihrem Arzt
    3. Sehen wir uns die Analyse zur Testsicherheit Aussage für Aussage an
    4. Wie stark ist die Leguangrippe tatsächlich verbreitet?
    5. Sie haben die Falsch-Positiven berechnet
      1. Das Gegenteil eines falsch-positiven Befunds ist ein richtig-negativer
    6. Alle diese Begriffe beschreiben bedingte Wahrscheinlichkeiten
    7. 1% der Bevölkerung hat Leguangrippe
      1. Achten Sie auf den Basisratenfehler
    8. Ihr Risiko, Leguangrippe zu haben, ist im Grunde ziemlich gering
    9. Denken Sie in simplen ganzen Zahlen über komplexe Wahrscheinlichkeiten nach
    10. Die Bayes-Regel kümmert sich um Basisraten und bedingte Wahrscheinlichkeiten
    11. Sie können die Bayes-Regel wiederholt anwenden
    12. Der zweite Test ist negativ
    13. Die Testsicherheit beim neuen Test ist anders
    14. Neue Information kann Ihre Basisrate verändern
    15. Große Erleichterung!
  11. 7. Subjektive Wahrscheinlichkeiten: Der Glaube an Zahlen
    1. Manchmal ist es ganz gut, sich Zahlen auszudenken
    2. Bei Terra Inco Invest ist man auf Ihre Hilfe angewiesen
    3. Die Analysten gehen sich gegenseitig an den Hals
    4. Subjektive Wahrscheinlichkeiten als Ausdruck von Expertenmeinungen
    5. Vielleicht zeigen sich in den subjektiven Wahrscheinlichkeiten gar keine Meinungsverschiedenheiten
    6. Die Analysten haben ihre subjektiven Wahrscheinlichkeiten eingereicht
    7. Der Geschäftsführer sieht nicht, worauf Sie hinauswollen
    8. Der Geschäftsführer mag Ihre Arbeit
    9. Die Standardabweichung misst, wie weit Datenpunkte vom Mittelwert abweichen
    10. Es gibt keine: Dummen Fragen
    11. Diese Nachricht trifft Sie aus heiterem Himmel
    12. Die Bayes-Regel eignet sich gut zum Revidieren subjektiver Wahrscheinlichkeiten
    13. Der Geschäftsführer weiß genau, was er mit dieser Information machen muss
    14. Besitzer russischer Aktien im Freudentaumel!
  12. 8. Heuristiken: Analysieren wie ein echter Mensch
    1. Die Realität konfrontiert Sie mit mehr Variablen, als Sie bewältigen können
    2. Die Abfall-Scouts haben dem Stadtrat ihren Bericht vorgelegt
    3. Die Abfall-Scouts haben das Städtchen richtig auf Vordermann gebracht
    4. Die Abfall-Scouts haben die Effektivität ihrer Kampagne erfasst
    5. Der Auftrag lautet, das Abfallaufkommen zu reduzieren
    6. Die Höhe des Abfallaufkommens ist unmöglich zu messen
    7. Stellen Sie eine schwierige Frage, und man wird eine leichtere beantworten
    8. Hinter der Datenreuther Abfallfrage steht ein komplexes System
    9. Ein umfassendes Abfallmessmodell lässt sich weder planen noch umsetzen
    10. Heuristiken sind der Mittelweg zwischen reinem Bauchgefühl und Optimierung
    11. Es gibt keine: Dummen Fragen
    12. Nehmen Sie einen schnellen und sparsamen Baum
    13. Gibt es eine einfachere Möglichkeit, den Erfolg der Abfall-Scouts zu beurteilen?
    14. Auch Stereotype sind Heuristiken
    15. Ihre Analyse ist bereit zur Vorlage
    16. Allem Anschein nach hat Ihre Analyse den Stadtrat beeindruckt
  13. 9. Histogramme: Zahlen nehmen Form an
    1. Wie viel kann Ihnen ein Balkendiagramm mitteilen?
    2. Ihre jährliche Leistungsbeurteilung erwartet Sie
    3. Nach mehr Geld zu fragen, könnte auf Verschiedenes hinauslaufen
    4. Ein paar Daten mit Gehalts- und Honorarerhöhungen
    5. Histogramme bilden gruppierte Häufigkeiten ab
    6. Lücken zwischen Histogrammbalken entsprechen Lücken in der Werteverteilung
    7. R installieren und in Betrieb nehmen
    8. Laden Sie Ihre Daten in R
    9. R macht schöne Histogramme
    10. Es gibt keine: Dummen Fragen
    11. Legen Sie Histogramme aus Untergruppen Ihrer Daten an
    12. Verhandeln zahlt sich aus
    13. Was würde verhandeln für Sie bedeuten?
  14. 10. Regression: Vorhersagen
    1. Machen Sie mal eine Prognose
    2. Was werden Sie jetzt mit all dem Geld machen?
    3. Zu analysieren, was man fordern kann, könnte heftig werden
    4. Sieh mal an ... ein Gehaltsschätzer!
    5. Der Algorithmus muss eine Methode zur Vorhersage von Gehaltserhöhungen enthalten
    6. Es gibt keine: Dummen Fragen
    7. Streudiagramm-Magneten
    8. Streudiagramm-Magneten
    9. Es gibt keine: Dummen Fragen
    10. Streudiagramme, die zwei Variablen vergleichen
    11. Eine Gerade könnte Ihren Kunden sagen, worauf sie abzielen sollten
    12. Sagen Sie mit dem Mittelwertsgraphen Werte in allen Bändern voraus
    13. Die Regressionsgerade sagt die bewilligten Gehaltserhöhungen voraus
    14. Es gibt keine: Dummen Fragen
    15. Die Gerade ist nützlich, wenn Ihre Daten ausreichend hoch korrelieren
    16. Es gibt keine: Dummen Fragen
    17. Für präzise Vorhersagen brauchen Sie eine Formel
      1. a ist der Schnittpunkt mit der y-Achse
      2. b ist die Steigung
    18. Was passiert, wenn R ein Regressionsobjekt anlegt?
    19. Regressionsgleichung und Streudiagramm arbeiten Hand in Hand
    20. Die Regressionsgleichung ist der Algorithmus für den Gehaltsschätzer
    21. Es gibt keine: Dummen Fragen
    22. Ihr Gehaltsschätzer hat nicht ganz wie geplant funktioniert ...
  15. 11. Der Zufallsfehler: Ups, daneben!
    1. Das Leben ist ein furchtbares Durcheinander
    2. Sie haben Ihre Kunden ganz schön aufgemischt
    3. Was hat Ihr Gehaltsschätzer-Algorithmus gemacht?
    4. Kunden-Untergruppen
    5. Der Typ, der 25% mehr gefordert hat, liegt außerhalb unseres Modells
    6. Was tun mit Kunden, die Vorhersagen außerhalb des Geltungsbereichs wollen?
    7. Es gibt keine: Dummen Fragen
    8. Der Typ, der aufgrund von Extrapolation gefeuert wurde, hat sich wieder beruhigt
    9. Sie haben lediglich einen Teil des Grundproblems gelöst
    10. Wie sehen die Daten zu diesen chaotischen Ergebnissen aus?
    11. Zufallsfehler sind Abweichungen von Ihrer Vorhersage
    12. Der Zufallsfehler hilft sowohl Ihnen als auch Ihren Kunden
    13. Beziffern Sie den Zufallsfehler
    14. Messen Sie die Residuenverteilung mit dem Standardschätzfehler
    15. Das von R berechnete Modell kennt den Standardschätzfehler bereits
    16. Es gibt keine: Dummen Fragen
    17. Die Zusammenfassung Ihres linearen Modells in R liefert Ihnen den Standardschätzfehler
    18. Bei der Datensegmentierung geht es immer um den Umgang mit dem Zufallsfehler
    19. Gute Regressionsmodelle balancieren Datenaufklärung und Vorhersagegüte aus
    20. Es gibt keine: Dummen Fragen
    21. Die Modelle für die Datensegmente funktionieren besser als die ursprünglichen
    22. Ihre Kunden kommen scharenweise zurück
  16. 12. Relationale Datenbanken: Sind Sie beziehungsfähig?
    1. Wie organisiert man Daten, die ganz schlimm multivariat sind?
    2. Bei der Datenreuther Depesche möchte man die verkaufte Auflage analysieren
    3. Diese Daten dokumentieren den Geschäftsverlauf
    4. Sie müssen wissen, wie die Datentabellen zusammenhängen
    5. Datenbank = Sammlung von Informationen mit klar definierten Beziehungen
    6. An Ihre Informationen kommen Sie, wenn Sie einen Pfad entlang der Beziehungen anlegen
    7. Legen Sie eine Arbeitsmappe an, die diesen Pfad abbildet
    8. Ihre Zusammenfassung verknüpft Artikelanzahl und verkaufte Auflage
    9. Allem Anschein nach kommt Ihr Streudiagramm gut an
    10. Es gibt keine: Dummen Fragen
    11. Das war schon reichlich mühsam, diese ganzen Daten zusammenkopieren zu müssen
    12. Relationale Datenbanken nehmen Ihnen die Verwaltung von Beziehungen ab
    13. Bei der Depesche hat man nach Ihrem Diagramm eine Datenbank eingerichtet
    14. Die Depesche hat Ihnen Daten mit einer SQL-Abfrage zusammengestellt
    15. Endlose Auswertungsmöglichkeiten für Daten aus einer relationalen Datenbank
    16. Die Person auf dem Cover – das sind SIE
  17. 13. Datenbereinigung: Ordnung erzwingen
    1. Ihre Daten sind nutzlos ...
    2. Gerade erhalten Sie den Kandidatenstamm einer aufgelösten Personalberatungsfirma
    3. Die schmuddelige Seite der Datenanalyse
    4. O’Lymp braucht die Liste für seine Vermittler
    5. Datenbereinigung hängt entscheidend von der Vorbereitung ab
    6. Sobald Ihr Konzept steht, können Sie mit der eigentlichen Datenbereinigung beginnen
    7. Nehmen Sie die Raute als Spaltentrenner
    8. Excel hat die Daten mit dem Trenner auf die Spalten verteilt
    9. Beseitigen Sie das Caret mit der WECHSELN-Funktion
    10. Es gibt keine: Dummen Fragen
    11. Sie haben gerade die Vornamen bereinigt
    12. Für die WECHSELN-Funktion sind die Nachnamen zu komplex
    13. Komplexe Muster mit verschachtelten Textfunktionen bearbeiten
    14. Komplexe Muster mit regulären Ausdrücken in R aufbrechen
    15. Der Aufruf der sub()-Funktion hat die Nachnamen repariert
    16. Es gibt keine: Dummen Fragen
    17. Sie können Ihrem Auftraggeber die Daten jetzt liefern
    18. Möglich, dass Sie noch nicht ganz fertig sind!
    19. Sortieren Sie Ihre Daten, dann stehen die Dubletten untereinander
    20. Die Daten könnten aus einer relationalen Datenbank stammen
    21. Entfernen Sie die doppelten Namenseinträge
    22. Jetzt sind alle Einträge im Datensatz sauber und eindeutig
    23. Die Rekrutierungsaktion bei O’Lymp ist ein Wahnsinnserfolg!
    24. Zeit, Abschied zu nehmen!
    25. Schön, dass Sie uns in Datenreuth besucht haben!
  18. A. Was übrig bleibt: Die Top Ten: der Themen, die wir nicht behandelt haben
    1. Wir haben ein ganz schönes Stück des Weges zurückgelegt
    2. 1. Alles, was irgendwie mit Statistik zu tun hat
    3. 2. Excel-Kenntnisse
    4. 3. Edward Tufte und seine Prinzipien der Informationsvisualisierung
    5. 4. Pivot-Tabellen
    6. 5. Das R-Ökosystem
    7. 6. Nicht-lineare und multiple Regression
    8. 7. Statistisches Hypothesentesten
    9. 8. Zufall
    10. 9. Google-Docs
    11. 10. Ihre Fachkompetenz
  19. B. R installieren: Machen Sie R einsatzbereit!
    1. Unter der Haube ist die geballte Leistungsfähigkeit dieses Datenakrobats enorm komplex
    2. Bringen Sie R ans Laufen
  20. C. Excels Erweiterungen aktivieren: Solver und Analyse-Funktionen
    1. Ein paar der interessantesten Funktionen von Excel werden standardmäßig nicht mit installiert
    2. Installieren Sie die Datenanalysefunktionen in Excel
  21. Stichwortverzeichnis