O'Reilly logo

Stay ahead with the world's most comprehensive technology and business learning platform.

With Safari, you learn the way you learn best. Get unlimited access to videos, live online training, learning paths, books, tutorials, and more.

Start Free Trial

No credit card required

Data Mining mit Microsoft SQL Server

Book Description

Data Mining ist das systematische Anwenden von Methoden auf einen Datenbestand mit dem Ziel der Mustererkennung. Viele Unternehmen müssen mit sehr großen Datenmengen umgehen, aus denen Sie entscheidungsrelevante Informationen extrahieren möchten, denn die Datenbestände enthalten wertvolle Informationen. Dieses Buch ist praxisbezogen aufgebaut und stellt Ihnen von den allgemeinen Grundlagen ausgehend Data Mining mithilfe von Microsoft-Lösungen vor. Im Zentrum stehen SQL Server 2005 und SQL Server 2008, aber auch die Office-Seite und Entwickleraspekte der Analyse werden Ihnen vorgestellt. Zahlreiche Anwendungsbeispiele mit ausführlichen Schritt-für-Schritt-Anleitungen und den notwendigen Screenshots helfen Ihnen dabei, einen leichten Einstieg in Data Mining zu finden.

Table of Contents

  1. Copyright
  2. Vorwort
  3. Einleitung
  4. Data Mining-Konzepte
    1. Einführung in Data Mining
      1. Überblick über Data Mining
      2. Beispiel 1: Vorhersage von Flugstornierungen
      3. Beispiel 2: Warenkorbanalyse
      4. Beispiel 3: Marktsegmentierung
      5. Zusammenfassung
    2. Data Mining-Algorithmen
      1. Daten- und Inhaltstypen
      2. Algorithmengruppen
      3. Zusammenfassung
    3. Überlegungen zur Datenvorbereitung
      1. Handhabung von Einträgen
      2. Handhabung von Attributen
      3. Fehlende und ungenaue Werte
      4. Strukturelle Anpassungen
      5. Zusammenfassung
    4. Überlegungen zur Validierung von Miningmodellen
      1. Validierungstechniken
      2. Darstellung von Validierungsergebnissen
      3. Zusammenfassung
  5. Die Data Mining-Plattform von Microsoft
    1. Anwendungen und Technologien im Überblick
      1. SQL Server 2005/2008
      2. Skript- und Abfragesprachen
      3. Office 2007
      4. Visual Studio 2005/2008
      5. Objektbibliotheken und Steuerelemente
      6. Zusammenfassung
    2. Unterschiede in Versionen und Editionen von SQL Server
      1. Übersicht der Unterschiede
      2. Versionen von SQL Server
      3. Editionen von SQL Server
      4. Zusammenfassung
    3. Einrichten der Arbeitsumgebung
      1. Bestehende Arbeitsumgebung
      2. Erforderliche Office-Komponenten
      3. Visual Studio 2008 Professional Edition
      4. SQL Server 2008 Developer Edition
      5. Die Beispieldatenbank Adventure Works
      6. Beispielprojekte für SQL Server
      7. SQL Server Data Mining-Add-Ins für Office 2007
      8. Zusammenfassung
  6. Data Mining mit Office 2007
    1. Einführung in die Data Mining-Add-Ins
      1. Technische Voraussetzungen
      2. Verbindung zu Analysis Services herstellen
      3. Beschreibung und Funktionen der Add-Ins
      4. Eigene Daten in Excel verwenden
      5. Zusammenfassung
    2. Tabellenanalysetools für Excel 2007
      1. Wichtige Einflussfaktoren analysieren
      2. Kategorien erkennen
      3. Vorhersagen treffen
      4. Ausnahmen hervorheben
      5. Szenarienanalysen
      6. Warenkörbe analysieren
      7. Zusammenfassung
    3. Data Mining-Client für Excel 2007
      1. Daten zur Auswertung vorbereiten
      2. Miningmodelle erstellen
      3. Externe Daten verwenden
      4. Leistung von Miningmodellen bewerten
      5. Vorhersagen treffen
      6. Weitere Funktionen im Data Mining-Client
      7. Zusammenfassung
    4. Excel-Funktionen für Data Mining
      1. Erstellen des Beispielminingmodells
      2. Verwenden der Excel-Funktionen für Data Mining
      3. Zusammenfassung
    5. Data Mining-Vorlagen für Visio 2007
      1. Erstellen der Beispielminingmodelle
      2. Diagramme für Miningmodelle erstellen
      3. Zusammenfassung
  7. Data Mining mit SQL Server 2008
    1. Miningmodelle im BIDS erstellen
      1. Überblick über Strukturen und Modelle
      2. Neues Projekt anlegen
      3. Datenquelle und Datenquellensicht anlegen
      4. Miningstruktur und -modell anlegen
      5. Miningstruktur bereitstellen und verarbeiten
      6. Miningmodell anzeigen
      7. Zusammenfassung
    2. Miningmodelle im BIDS abfragen
      1. Vorhersagen mit SINGLETON-Abfragen
      2. Vorhersagen mit SQL-Abfragen
      3. Zusammenfassung
    3. Validieren von Miningmodellen
      1. Validierung nach der HoldOut-Methode
      2. Unterschiedliche Modelle vergleichen
      3. Durchführen einer Kreuzvalidierung
      4. Zusammenfassung
    4. Data Mining und SQL Server Integration Services
      1. Überblick über SQL Server Integration Services
      2. Ausgewählte Tasks für Data Mining-Szenarien
      3. Ausgewählte Tasks für Text Mining-Szenarien
      4. Zusammenfassung
    5. Data Mining und SQL Server Reporting Services
      1. Entwerfen eines Berichts
      2. Bericht bearbeiten
      3. Bereitstellen und Abrufen eines Berichts
      4. Zusammenfassung
  8. Fallbeispiele
    1. Warenkorbanalysen mit Zuordnungsregeln durchführen
      1. Geschachtelte Tabellen verstehen
      2. Miningmodell mit geschachtelten Tabellen erstellen
      3. Miningmodell anzeigen
      4. Miningmodell abfragen
      5. Zusammenfassung
    2. Kundensegmente mit Clustering erkennen
      1. Miningmodell erstellen
      2. Miningmodell anzeigen
      3. Miningmodell abfragen
      4. Zusammenfassung
    3. Benutzerverhalten auf Websites mit Sequence Clustering analysieren
      1. Miningmodell erstellen
      2. Miningmodell anzeigen
      3. Miningmodell abfragen
      4. Zusammenfassung
    4. Kennzahlen mit dem Time Series-Algorithmus vorhersagen
      1. Miningmodell erstellen
      2. Miningmodell anzeigen
      3. Miningmodell abfragen
      4. Zusammenfassung
    5. Streuverluste mit neuronalen Netzwerken vermindern
      1. Miningmodell erstellen
      2. Miningmodell anzeigen
      3. Miningmodell abfragen
      4. Zusammenfassung
  9. Fortgeschrittene Techniken und Entwicklung
    1. Einführung in ASSL und XMLA
      1. Anwendungsgebiet von XMLA
      2. Methoden und Erweiterungen von XMLA
      3. XMLA-Abfragen im Management Studio erstellen
      4. XMLA mit SQL Server Profiler weiterverwenden
      5. DMX mit XMLA versenden
      6. Zusammenfassung
    2. Data Mining-Erweiterungen (DMX)
      1. Sprachelemente von DMX
      2. DMX-Abfragen in Management Studio erstellen
      3. Miningstrukturen und -modelle erstellen
      4. Vorhersageabfragen erstellen
      5. Weitere Abfragen für Miningmodelle
      6. Zusammenfassung
    3. Analysis Management Objects (AMO)
      1. Konzepte und Objektmodell von AMO
      2. Erstellen der Beispielanwendung
      3. Datenbankverbindung herstellen
      4. Mit Miningstrukturen und -modellen arbeiten
      5. Datenbanken sichern und wiederherstellen
      6. AMO verteilen
      7. Zusammenfassung
    4. ActiveX Data Objects MultiDimensional .NET (ADOMD.NET)
      1. Konzepte und Objektmodellvon ADOMD.NET
      2. Erstellen der Beispielanwendung
      3. Datenbankverbindungherstellen
      4. Datenabfragen ausführen
      5. ADOMD.NET verteilen
      6. Zusammenfassung
    5. Data Mining Viewer Controls
      1. Überblick der Data Mining Viewer Controls
      2. Erstellen der Beispielanwendung
      3. Data Mining Viewer Controls verteilen
      4. Zusammenfassung
  10. Algorithmus-Parameter
    1. Microsoft Association Rules-Algorithmus
    2. Microsoft Clustering-Algorithmus
    3. Microsoft Decision Trees-Algorithmus
    4. Microsoft Linear Regression-Algorithmus
    5. Microsoft Logistic Regression-Algorithmus
    6. Microsoft Naive Bayes-Algorithmus
    7. Microsoft Neural Network-Algorithmus
    8. Microsoft Sequence Clustering-Algorithmus
    9. Microsoft Time Series-Algorithmus
  11. Über die Autoren