O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Data Mining, 2nd Edition

Book Description

In den riesigen Datenbergen moderner Datenbanken steckt unentdecktes Wissen, das ohne geeignete Hilfsmittel kaum zu Tage gefördert werden kann. Hier setzt das Data Mining an und liefert Methoden und Algorithmen, um bisher unbekannte Zusammenhänge zu entdecken. Nach der Vermittlung der Grundlagen und Anwendungsklassen des Data Mining in den ersten beiden Kapiteln wird in Kapitel 3 auf geeignete Darstellungsmöglichkeiten für Data-Mining-Modelle eingegangen; Kapitel 4 behandelt die Algorithmen und Verfahrensklassen, Kapitel 5 geht auf konkrete Anwendungsarchitekturen ein. Das Buch deckt den Stoff einer einsemestrigen Vorlesung zu Data Mining an Universitäten oder Fachhochschulen ab und ist als klassisches Lehrbuch konzipiert. Es bietet Zusammenfassungen, zahlreiche Beispiele und Übungsaufgaben.

Table of Contents

  1. Cover
  2. Title page
  3. Impressum
  4. Vorwort
  5. Inhaltsverzeichnis
  6. 1 Einführung
    1. 1.1 Auswertung von Massendaten
    2. 1.2 Data Mining und Business Intelligence
    3. 1.3 Ablauf einer Datenanalyse
    4. 1.4 Interdisziplinarität
    5. 1.5 Erfolgreiche Beispiele
    6. 1.6 Werkzeuge
      1. 1.6.1 KNIME
      2. 1.6.2 WEKA.
      3. 1.6.3 JavaNNS
  7. 2 Grundlagen des Data Mining
    1. 2.1 Grundbegriffe
    2. 2.2 Datentypen
    3. 2.3 Abstands- und Ähnlichkeitsmaße
    4. 2.4 Grundlagen Künstlicher Neuronaler Netze
    5. 2.5 Logik
    6. 2.6 Überwachtes und unüberwachtes Lernen
  8. 3 Anwendungsklassen
    1. 3.1 Cluster-Analyse
    2. 3.2 Klassifikation.
    3. 3.3 Numerische Vorhersage
    4. 3.4 Assoziationsanalyse.
    5. 3.5 Text Mining
    6. 3.6 Web Mining
  9. 4 Wissensrepräsentation
    1. 4.1 Entscheidungstabelle
    2. 4.2 Entscheidungsbäume
    3. 4.3 Regeln
    4. 4.4 Assoziationsregeln
    5. 4.5 Instanzenbasierte Darstellung
    6. 4.6 Repräsentation von Clustern.
    7. 4.7 Neuronale Netze als Wissensspeicher
  10. 5 Klassifikation
    1. 5.1 K-Nearest Neighbour
      1. 5.1.1 K-Nearest-Neighbour-Algorithmus
      2. 5.1.2 Ein verfeinerter Algorithmus
    2. 5.2 Entscheidungsbaumlernen
      1. 5.2.1 Erzeugen eines Entscheidungsbaums
      2. 5.2.2 Auswahl eines Attributs
      3. 5.2.3 Der ID3-Algorithmus zur Erzeugung eines Entscheidungsbaums
      4. 5.2.4 Entropie
      5. 5.2.5 Der Gini-Index
      6. 5.2.6 Der C4.5-Algorithmus
      7. 5.2.7 Probleme beim Entscheidungsbaumlernen
      8. 5.2.8 Entscheidungsbaum und Regeln
    3. 5.3 Naive Bayes
      1. 5.3.1 Bayessche Formel
      2. 5.3.2 Der Naive-Bayes-Algorithmus
    4. 5.4 Vorwärtsgerichtete Neuronale Netze.
      1. 5.4.1 Architektur
      2. 5.4.2 Das Backpropagation-of-Error-Lernverfahren
      3. 5.4.3 Modifikationen des Backpropagation-Algorithmus
      4. 5.4.4 Ein Beispiel
    5. 5.5 Support Vector Machines
      1. 5.5.1 Grundprinzip.
      2. 5.5.2 Formale Darstellung von Support Vector Machines
      3. 5.5.3 Ein Beispiel
  11. 6 Cluster-Analyse
    1. 6.1 Arten der Cluster-Analyse
    2. 6.2 Der k-Means-Algorithmus
    3. 6.3 Der k-Medoid-Algorithmus
    4. 6.4 Erwartungsmaximierung
    5. 6.5 Agglomeratives Clustern.
    6. 6.6 Dichtebasiertes Clustern
    7. 6.7 Clusterbildung mittels selbstorganisierender Karten
      1. 6.7.1 Aufbau.
      2. 6.7.2 Lernen
      3. 6.7.3 Visualisierung einer SOM.
      4. 6.7.4 Ein Beispiel
    8. 6.8 Clusterbildung mittels neuronaler Gase
    9. 6.9 Clusterbildung mittels ART
    10. 6.10 Der Fuzzy-c-Means-Algorithmus
  12. 7 Assoziationsanalyse
    1. 7.1 Der A-Priori-Algorithmus.
      1. 7.1.1 Generierung der Kandidaten
      2. 7.1.2 Erzeugen der Regeln.
    2. 7.2 Frequent Pattern Growth
    3. 7.3 Assoziationsregeln für spezielle Aufgaben
      1. 7.3.1 Hierarchische Assoziationsregeln
      2. 7.3.2 Quantitative Assoziationsregeln
      3. 7.3.3 Erzeugung von temporalen Assoziationsregeln
  13. 8 Datenvorbereitung
    1. 8.1 Motivation
    2. 8.2 Arten der Datenvorbereitung
      1. 8.2.1 Datenselektion und -integration
      2. 8.2.2 Datensäuberung
      3. 8.2.3 Datenreduktion
      4. 8.2.4 Datentransformation
    3. 8.3 Ein Beispiel
  14. 9 Bewertung
    1. 9.1 Prinzip der minimalen Beschreibungslängen
    2. 9.2 Interessantheitsmaße für Assoziationsregeln
      1. 9.2.1 Support
      2. 9.2.2 Konfidenz
      3. 9.2.3 Gain-Funktion.
      4. 9.2.4 p-s-Funktion
      5. 9.2.5 Lift
    3. 9.3 Gütemaße und Fehlerkosten
      1. 9.3.1 Fehlerraten
      2. 9.3.2 Weitere Gütemaße für Klassifikatoren
      3. 9.3.3 Fehlerkosten.
    4. 9.4 Testmengen
    5. 9.5 Qualität von Clustern
    6. 9.6 Visualisierung
  15. 10 Eine Data-Mining-Aufgabe
    1. 10.1 Die Aufgabe
    2. 10.2 Das Problem
    3. 10.3 Die Daten
    4. 10.4 Datenvorbereitung.
    5. 10.5 Experimente
      1. 10.5.1 K-Nearest Neighbour
      2. 10.5.2 Naive Bayes
      3. 10.5.3 Entscheidungsbaumverfahren
      4. 10.5.4 Neuronale Netze.
    6. 10.6 Auswertung der Ergebnisse
  16. A Anhang
    1. A.1 Iris-Daten
    2. A.2 Sojabohnen
    3. A.3 Wetter-Daten
    4. A.4 Kontaktlinsen-Daten
  17. Abbildungsverzeichnis
  18. Tabellenverzeichnis
  19. Verzeichnis der Symbole
  20. Verzeichnis der Abkürzungen
  21. Literaturverzeichnis
  22. Index
  23. Fußnoten