Data Science, 2nd Edition

Book description

Dieses Buch bietet eine umfassende Einführung in Data Science und dessen praktische Relevanz für Unternehmen. Dabei werden sowohl Aufgabenfelder und Methoden sowie Rollen- und Organisationsmodelle vorgestellt sowie Konzepte und Architekturen für Data Science erläutert. Zahlreiche Anwendungsfälle und Praxisbeispiele geben Einblicke in die reale Welt von Data Science und erlauben dem Leser einen direkten Transfer zu seiner täglichen Arbeit.

Die 2., überarbeitete Auflage wurde um neue Themen wie Feature Selection und Deep Reinforcement Learning sowie eine neue Fallstudie erweitert.

Table of contents

  1. Cover
  2. Über die Autoren
  3. Titel
  4. Impressum
  5. Vorwort zur 2. Auflage
  6. Vorwort
  7. Inhaltsübersicht
  8. Inhaltsverzeichnis
  9. 1 Einleitung
    1. Uwe Haneke · Stephan Trahasch · Michael Zimmer · Carsten Felden
    2. 1.1 Von Business Intelligence zu Data Science
    3. 1.2 Data Science und angrenzende Gebiete
    4. 1.3 Vorgehen in Data-Science-Projekten
    5. 1.4 Struktur des Buches
  10. 2 (Advanced) Analytics is the new BI?
    1. Uwe Haneke
    2. 2.1 Geschichte wiederholt sich?
    3. 2.2 Die DIKW-Pyramide erklimmen
    4. 2.3 Vom Nebeneinander zum Miteinander
    5. 2.4 Fazit
  11. 3 Data Science und künstliche Intelligenz – der Schlüssel zum Erfolg?
    1. Marc Beierschoder · Benjamin Diemann · Michael Zimmer
    2. 3.1 Zwischen Euphorie und Pragmatismus
    3. 3.2 Wann ist Data Science und KI das Mittel der Wahl?
    4. 3.3 Realistische Erwartungen und klare Herausforderungen
    5. 3.4 Aus der Praxis
    6. 3.4.1 Die Automobilbranche als Beispiel
    7. 3.4.1.1 Machen Sie Ihren Kunden ein Angebot, das sie nicht ausschlagen können
    8. 3.4.1.2 Spinning the Customer Life Cycle – Schaffen Sie mehr als eine Runde?
    9. 3.5 Fazit
  12. 4 Konzeption und Entwicklung von Data-driven Products/Datenprodukten
    1. Christoph Tempich
    2. 4.1 Einleitung
    3. 4.2 Datenprodukte
    4. 4.2.1 Definition
    5. 4.2.2 Beispiele für Datenprodukte
    6. 4.2.3 Herausforderungen des Produktmanagements für Datenprodukte
    7. 4.3 Digitale Produktentwicklung
    8. 4.3.1 Produktmanagement
    9. 4.3.2 Agile Entwicklung
    10. 4.3.3 Lean Startup
    11. 4.3.4 Data Science
    12. 4.3.5 Data-centric Business Models
    13. 4.4 Datenprodukte definieren
    14. 4.4.1 Ideengenerierung für Datenprodukte entlang der Customer Journey
    15. 4.4.2 Value Propositions von Datenprodukten
    16. 4.4.3 Ziele und Messung
    17. 4.4.4 Die Erwartung an die Güte des Modells bestimmen
    18. 4.4.5 Mit dem Datenprodukt beginnen
    19. 4.4.6 Kontinuierliche Verbesserung mit der Datenwertschöpfungskette
    20. 4.4.7 Skalierung und Alleinstellungsmerkmal
    21. 4.5 Kritischer Erfolgsfaktor Feedbackschleife
    22. 4.6 Organisatorische Anforderungen
    23. 4.7 Technische Anforderungen
    24. 4.8 Fazit
  13. 5 Grundlegende Methoden der Data Science
    1. Stephan Trahasch · Carsten Felden
    2. 5.1 Einleitung
    3. 5.2 Data Understanding und Data Preparation
    4. 5.2.1 Explorative Datenanalyse
    5. 5.2.2 Transformation und Normalisierung
    6. 5.3 Überwachte Lernverfahren
    7. 5.3.1 Datenaufteilung
    8. 5.3.2 Bias-Variance-Tradeoff
    9. 5.3.3 Klassifikationsverfahren
    10. 5.4 Unüberwachte Lernverfahren und Clustering
    11. 5.5 Reinforcement Learning
    12. 5.5.1 Aspekte des Reinforcement Learning
    13. 5.5.2 Bestandteile eines Reinforcement-Learning-Systems
    14. 5.6 Evaluation
    15. 5.6.1 Ausgewählte Qualitätsmaße im Kontext von Klassifikationsaufgabenstellungen
    16. 5.6.2 Ausgewählte Qualitätsmaße im Kontext von Clusterungen
    17. 5.7 Weitere Ansätze
    18. 5.7.1 Deep Learning
    19. 5.7.2 Cognitive Computing
    20. 5.8 Fazit
  14. 6 Feature Selection
    1. Bianca Huber
    2. 6.1 Weniger ist mehr
    3. 6.2 Einführung in die Feature Selection
    4. 6.2.1 Definition
    5. 6.2.2 Abgrenzung
    6. 6.3 Ansätze der Feature Selection
    7. 6.3.1 Der Filter-Ansatz
    8. 6.3.2 Der Wrapper-Ansatz
    9. 6.3.3 Der Embedded-Ansatz
    10. 6.3.4 Vergleich der drei Ansätze
    11. 6.4 Feature Selection in der Praxis
    12. 6.4.1 Empfehlungen
    13. 6.4.2 Anwendungsbeispiel
    14. 6.5 Fazit
  15. 7 Deep Learning
    1. Klaus Dorer
    2. 7.1 Grundlagen neuronaler Netzwerke
    3. 7.1.1 Menschliches Gehirn
    4. 7.1.2 Modell eines Neurons
    5. 7.1.3 Perzeptron
    6. 7.1.4 Backpropagation-Netzwerke
    7. 7.2 Deep Convolutional Neural Networks
    8. 7.2.1 Convolution-Schicht
    9. 7.2.2 Pooling-Schicht
    10. 7.2.3 Fully-Connected-Schicht
    11. 7.3 Deep Reinforcement Learning
    12. 7.4 Anwendung von Deep Learning
    13. 7.4.1 Sweaty
    14. 7.4.2 AudiCup
    15. 7.4.3 DRL im RoboCup
    16. 7.4.4 Deep-Learning-Frameworks
    17. 7.4.5 Standarddatensätze
    18. 7.4.6 Standardmodelle
    19. 7.4.7 Weitere Anwendungen
    20. 7.5 Fazit
  16. 8 Von einer BI-Landschaft zum Data & Analytics-Ökosystem
    1. Michael Zimmer · Benjamin Diemann · Andreas Holzhammer
    2. 8.1 Einleitung
    3. 8.2 Komponenten analytischer Ökosysteme
    4. 8.3 Vom Reporting zur industrialisierten Data Science
    5. 8.4 Data Science und Agilität
    6. 8.5 Entwicklungs-, Test- und Produktionsumgebungen für Data Science
    7. 8.6 Vom Spielplatz für Innovation zur Serienfertigung
    8. 8.7 Anwendungsbeispiel
    9. 8.8 Fazit
  17. 9 Self-Service und Governance im Data-Science-Umfeld: der emanzipierte Anwender
    1. Uwe Haneke · Michael Zimmer
    2. 9.1 Einleitung
    3. 9.2 Self-Service-Angebote für Data & Analytics
    4. 9.3 Data Governance und Self-Service
    5. 9.4 Self-Service-Datenaufbereitung und Data Science
    6. 9.5 Self-Service-Datenaufbereitung vs. ETL
    7. 9.6 Bimodale Data & Analytics: Segen oder Fluch?
    8. 9.7 Entwicklungen im Self-Service-Bereich
    9. 9.7.1 AutoML als Data-Scientist-Ersatz?
    10. 9.7.2 Augmented Analytics
    11. 9.8 Fazit
  18. 10 Data Privacy
    1. Victoria Kayser · Damir Zubovic
    2. 10.1 Die Rolle von Data Privacy für Analytics und Big Data
    3. 10.2 Rechtliche und technische Ausgestaltung von Data Privacy
    4. 10.2.1 Rechtliche Bestimmungen zu Data Privacy
    5. 10.2.2 Technische und methodische Ansätze zur Schaffung von Data Privacy
    6. 10.3 Data Privacy im Kontext des Analytics Lifecycle
    7. 10.3.1 Ideen generieren
    8. 10.3.2 Prototypen entwickeln
    9. 10.3.3 Implementieren der Lösung
    10. 10.4 Diskussion und Fazit
  19. 11 Gespräch zur digitalen Ethik
    1. Matthias Haun · Gernot Meier
    2. Fallstudien
  20. 12 Customer Churn mit Keras/TensorFlow und H2O
    1. Shirin Glander
    2. 12.1 Was ist Customer Churn?
    3. 12.1.1 Wie kann Predictive Analytics bei dem Problem helfen?
    4. 12.1.2 Wie können wir Customer Churn vorhersagen?
    5. 12.2 Fallstudie
    6. 12.2.1 Der Beispieldatensatz
    7. 12.2.2 Vorverarbeitung der Daten
    8. 12.2.3 Neuronale Netze mit Keras und TensorFlow
    9. 12.2.4 Stacked Ensembles mit H2O
    10. 12.3 Bewertung der Customer-Churn-Modelle
    11. 12.3.1 Kosten-Nutzen-Kalkulation
    12. 12.3.2 Erklärbarkeit von Customer-Churn-Modellen
    13. 12.4 Zusammenfassung und Fazit
  21. 13 Wirtschaftlichkeitsbetrachtung bei der Auswahl & Entwicklung von Data Science Eine Fallstudie im Online-Lebensmitteleinzelhandel
    1. Nicolas March
    2. 13.1 Herausforderungen in der Praxis
    3. 13.1.1 Data-Science-Anwendungen im Online-LEH
    4. 13.1.2 Auswahl und Umsetzung wirtschaftlicher Anwendungsfälle
    5. 13.2 Fallstudie: Kaufempfehlungssysteme im Online-Lebensmitteleinzelhandel
    6. 13.2.1 Vorabanalysen zur Platzierung von Empfehlungen
    7. 13.2.2 Prototypische Entwicklung eines Empfehlungsalgorithmus
    8. 13.2.3 MVP und testgetriebene Entwicklung der Recommendation Engine
    9. 13.3 Fazit
  22. 14 Analytics im Onlinehandel
    1. Mikio Braun
    2. 14.1 Einleitung
    3. 14.2 Maschinelles Lernen: von der Uni zu Unternehmen
    4. 14.3 Wie arbeiten Data Scientists und Programmierer zusammen?
    5. 14.4 Architekturmuster, um maschinelle Lernmethoden produktiv zu nehmen
    6. 14.4.1 Architekturmuster des maschinellen Lernens
    7. 14.4.2 Architekturmuster, um Modelle auszuliefern
    8. 14.4.3 Datenvorverarbeitung und Feature-Extraktion
    9. 14.4.4 Automation und Monitoring
    10. 14.4.5 Integrationsmuster für maschinelles Lernen
    11. 14.5 Was kann man sonst auf Firmenebene tun, um Data Science zu unterstützen?
    12. 14.6 Fazit
  23. 15 Predictive Maintenance
    1. Marco Huber
    2. 15.1 Einleitung
    3. 15.2 Was ist Instandhaltung?
    4. 15.2.1 Folgen mangelhafter Instandhaltung
    5. 15.2.2 Wettbewerbsfähige Produktion
    6. 15.3 Instandhaltungsstrategien
    7. 15.3.1 Reaktive Instandhaltung
    8. 15.3.2 Vorbeugende Instandhaltung
    9. 15.3.3 Vorausschauende Instandhaltung (Predictive Maintenance)
    10. 15.4 Prozessphasen der vorausschauenden Instandhaltung
    11. 15.4.1 Datenerfassung und -übertragung
    12. 15.4.2 Datenanalyse und Vorhersage
    13. 15.4.2.1 Unüberwachte Verfahren
    14. 15.4.2.2 Überwachte Verfahren
    15. 15.4.3 Planung und Ausführung
    16. 15.5 Fallbeispiele
    17. 15.5.1 Heidelberger Druckmaschinen
    18. 15.5.2 Verschleißmessung bei einem Werkzeugmaschinenhersteller
    19. 15.5.3 Vorausschauende Instandhaltung in der IT
    20. 15.6 Fazit
  24. 16 Scrum in Data-Science-Projekten
    1. Caroline Kleist · Olaf Pier
    2. 16.1 Einleitung
    3. 16.2 Kurzüberblick Scrum
    4. 16.3 Data-Science-Projekte in der Praxis
    5. 16.4 Der Einsatz von Scrum in Data-Science-Projekten
    6. 16.4.1 Eigene Adaption
    7. 16.4.2 Realisierte Vorteile
    8. 16.4.3 Herausforderungen
    9. 16.5 Empfehlungen
    10. 16.6 Fazit
  25. 17 Der Analytics-Beitrag zu einer Added-Value-Strategie 303 am Beispiel eines Kundenkartenunternehmens
    1. Matthias Meyer
    2. 17.1 Geschäftsmodell eines Multipartnerprogramms
    3. 17.2 Kundenbindung und Kundenbindungsinstrumente
    4. 17.3 Funktionen und Services eines Multipartnerprogrammbetreibers
    5. 17.3.1 Funktionen
    6. 17.3.2 Services und Vorteile aus Nutzer- und aus Partnerperspektive
    7. 17.4 Konkrete Herausforderungen des betrachteten Multipartnerprogrammbetreibers
    8. 17.5 Added-Value-Strategie
    9. 17.5.1 Hintergrund und Zielsetzung
    10. 17.5.2 Ausgangspunkt Datenbasis
    11. 17.6 Pilotierung ausgewählter Analytics-Ansätze
    12. 17.6.1 Analytische Ansatzpunkte
    13. 17.6.2 Pilotierung
    14. 17.7 Fazit
  26. 18 Künstliche Intelligenz bei der Zurich Versicherung – Anwendungen und Beispiele
    1. Michael Zimmer · Jörg Narr · Ariane Horbach · Markus Hatterscheid
    2. 18.1 Herausforderungen innerhalb der Versicherungsbranche
    3. 18.2 KI bei der Zurich Versicherung
    4. 18.3 Anwendungsfälle
    5. 18.3.1 Analyse von Leistungsinformationen mithilfe von MedEye
    6. 18.3.2 Bilderkennung im Antragsprozess der Motorfahrzeugversicherung in der Schweiz
    7. 18.3.3 Betrugserkennung im Kfz-Bereich
    8. 18.3.4 Verbesserung der Kundeninteraktion und des Kundenmanagements mit den Swiss Platform for Analytical and Cognitive Enterprise (SPACE) Services
    9. 18.4 Fazit
  27. Anhang
    1. A Autoren
    2. B Abkürzungen
    3. C Literaturverzeichnis
    4. Fußnoten
    5. Index

Product information

  • Title: Data Science, 2nd Edition
  • Author(s): Uwe Haneke, Stephan Trahasch, Michael Zimmer, Carsten Felden
  • Release date: February 2021
  • Publisher(s): dpunkt
  • ISBN: 9783864908224