Book description
Jak budować użytkowe rozwiązania uczenia maszynowego na podstawie nieoznakowanych danych.
Wielu ekspertów branżowych uważa uczenie nienadzorowane za kolejną granicę w dziedzinie sztucznej inteligencji, która może stanowić klucz do pełnej sztucznej inteligencji. Ponieważ większość danych na świecie jest nieoznakowana, nie można do nich zastosować konwencjonalnego uczenia nadzorowanego. Z kolei uczenie nienadzorowane może być stosowane wobec nieoznakowanych zbiorów danych w celu odkrycia istotnych wzorców ukrytych głęboko w tych danych, które dla człowieka mogą być niemal niemożliwe do odkrycia.
Autor Ankur Patel pokazuje, jak stosować uczenie nienadzorowane przy wykorzystaniu dwóch prostych platform dla języka Python: Scikit-learn oraz TensorFlow (wraz z Keras). Dzięki dołączonemu kodowi i praktycznym przykładom analitycy danych będą mogli identyfikować trudne do znalezienia wzorce w danych i odkrywać dogłębne zależności biznesowe, wykrywać anomalie, przeprowadzać automatyczną selekcję zmiennych i generować syntetyczne zbiory danych. Wystarczy znajomość programowania i nieco doświadczenia w uczeniu maszynowym, aby zająć się:
• Porównywaniem mocnych i słabych stron różnych podejść do uczenia maszynowego: uczenia nadzorowanego, nienadzorowanego i wzmacnianego.
• Przygotowywaniem i zarządzaniem projektami uczenia maszynowego.
• Budowaniem systemu wykrywania anomalii w celu wychwycenia oszustwa dotyczącego kard kredytowych.
• Rozdzielaniem użytkowników na wydzielone i jednorodne grupy.
• Przeprowadzaniem uczenia pół-nadzorowanego.
• Opracowywaniem systemów polecania filmów z użyciem ograniczonych automatów Boltzmanna.
• Generowaniem syntetycznych obrazów przy użyciu generujących sieci antagonistycznych.
„Badacze, inżynierowie i studenci docenią tę książkę pełną praktycznych technik uczenia nienadzorowanego, napisaną prostym językiem z nieskomplikowanymi przykładami w języku Python, które można szybko i skutecznie implementować.”
–Sarah Nagy
Główny analityk danych w firmie Edison
Ankur A. Patel jest wiceprezesem ds. informatyki analitycznej w firmie 7Park Data, wspieranej przez firmę inwestycyjną Vista Equity Partners. W firmie 7Park Data, Ankur i jego zespół analizy danych wykorzystują dane alternatywne do opracowywania produktów związanych z danymi dla funduszy hedgingowych i korporacji oraz rozwijają usługi uczenia maszynowego dla klientów firmowych.
Table of contents
- Okładka
-
Podstawy uczenia nienadzorowanego
-
Uczenie nienadzorowane w ekosystemie uczenia maszynowego
- Podstawowa terminologia związana z uczeniem maszynowym
- System oparty na zasadach a uczenie maszynowe
- Uczenie nadzorowane a nienadzorowane
- Używanie uczenia nienadzorowanego do poprawy rozwiązań wykorzystujących uczenie maszynowe
- Bliższe spojrzenie na algorytmy nadzorowane (1/2)
- Bliższe spojrzenie na algorytmy nadzorowane (2/2)
- Bliższe spojrzenie na algorytmy nienadzorowane (1/2)
- Bliższe spojrzenie na algorytmy nienadzorowane (2/2)
- Uczenie wzmacniane przy użyciu uczenia nienadzorowanego
- Uczenie pół-nadzorowane
- Udane zastosowania uczenia nienadzorowanego
- Podsumowanie
-
Kompleksowy projekt uczenia maszynowego
-
Konfiguracja środowiska
- Kontrola wersji: Git
- Klonowanie repozytorium Git dla tej książki
- Biblioteki naukowe: dystrybucja Anaconda dla języka Python
- Sieci neuronowe: TensorFlow i Keras
- Wzmacnianie gradientowe, wersja pierwsza: XGBoost
- Wzmacnianie gradientowe, wersja druga: LightGBM
- Algorytmy analizy skupień (grupowania)
- Interaktywne środowisko obliczeniowe: Jupyter Notebook
- Przegląd danych
- Przygotowanie danych (1/2)
- Przygotowanie danych (2/2)
- Przygotowanie modelu
- Modele uczenia maszynowego (część I)
- Metryki oceny
- Modele uczenia maszynowego (część II) (1/2)
- Modele uczenia maszynowego (część II) (2/2)
- Ocena czterech modeli przy użyciu zestawu testowego
- Zespoły modeli
- Ostateczny wybór modelu
- Potok produkcyjny
- Podsumowanie
-
Konfiguracja środowiska
-
Uczenie nienadzorowane w ekosystemie uczenia maszynowego
-
Uczenie nienadzorowane przy użyciu Scikit-Learn
-
Redukcja wymiarowości
- Motywacja do redukcji wymiarowości
- Algorytmy redukcji wymiarowości
- Analiza głównych składowych
- Rozkład według wartości osobliwych
- Losowe rzutowanie
- Isomap
- Skalowanie wielowymiarowe
- Lokalnie liniowe osadzanie
- Stochastyczne osadzanie sąsiadów z t-rozkładem
- Inne metody redukcji wymiarowości
- Uczenie słownikowe
- Analiza niezależnych składowych
- Podsumowanie
-
Wykrywanie anomalii
- Wykrywanie oszustw na kartach kredytowych
- Wykrywanie anomalii przy użyciu normalnej analizy PCA
- Wykrywanie anomalii przy użyciu rzadkiej analizy PCA
- Wykrywanie anomalii przy użyciu rdzeniowej analizy PCA
- Wykrywanie anomalii przy użyciu losowego rzutowania Gaussa
- Wykrywanie anomalii przy użyciu rzadkiego losowego rzutowania
- Nieliniowe wykrywanie anomalii
- Wykrywanie anomalii przy użyciu uczenia słownikowego
- Wykrywanie anomalii przy użyciu ICA
- Wykrywanie oszustw na zestawie testowym
- Podsumowanie
- Analiza skupień
- Segmentacja grup
-
Redukcja wymiarowości
-
Uczenie nienadzorowane przy użyciu TensorFlow i Keras
- Autokodery
-
Praktyczny autokoder
- Przygotowanie danych
- Elementy składowe autokodera
- Funkcje aktywacji
- Nasz pierwszy autokoder (1/2)
- Nasz pierwszy autokoder (2/2)
- Dwuwarstwowy, niezupełny autokoder z liniową funkcją aktywacji (1/2)
- Dwuwarstwowy, niezupełny autokoder z liniową funkcją aktywacji (2/2)
- Autokoder nieliniowy
- Nadmiarowy autokoder z aktywacją liniową
- Nadmiarowy autokoder z aktywacją liniową i wykluczaniem
- Rzadki, nadmiarowy autokoder z aktywacją liniową
- Rzadki, nadmiarowy autokoder z aktywacją liniową i wykluczaniem
- Praca z zaszumionymi zestawami danych
- Autokoder odszumiający (1/2)
- Autokoder odszumiający (2/2)
- Podsumowanie
- Uczenie pół-nadzorowane
-
Głębokie uczenie nienadzorowane przy użyciu TensorFlow i Keras
- Systemy rekomendacyjne przy użyciu ograniczonych automatów Boltzmanna
-
Wykrywanie cech przy użyciu sieci głębokiego przekonania
- Sieci głębokiego przekonania w szczegółach
- Klasyfikacja obrazów MNIST
- Ograniczone automaty Boltzmanna
- Szkolenie trzech automatów RBM dla sieci DBN (1/2)
- Szkolenie trzech automatów RBM dla sieci DBN (2/2)
- Pełna sieć DBN
- Jak uczenie nienadzorowane pomaga uczeniu nadzorowanemu (1/2)
- Jak uczenie nienadzorowane pomaga uczeniu nadzorowanemu (2/2)
- Klasyfikator obrazów wykorzystujący LightGBM
- Podsumowanie
- Generujące sieci antagonistyczne
-
Grupowanie szeregów czasowych
- Dane z EKG
- Podejście do grupowania szeregów czasowych
- Grupowanie szeregów czasowych przy użyciu k-kształtów na danych ECGFiveDays (1/2)
- Grupowanie szeregów czasowych przy użyciu k-kształtów na danych ECGFiveDays (2/2)
- Grupowanie szeregów czasowych przy użyciu k-kształtów na danych ECG5000 (1/2)
- Grupowanie szeregów czasowych przy użyciu k-kształtów na danych ECG5000 (2/2)
- Grupowanie szeregów czasowych przy użyciu k-średnich na danych ECG5000
- Grupowanie szeregów czasowych przy użyciu hierarchicznego DBSCAN na danych ECG5000
- Porównanie algorytmów grupowania szeregów czasowych
- Podsumowanie
- Podsumowanie
- Indeks (1/2)
- Indeks (2/2)
Product information
- Title: Praktyczne uczenie nienadzorowane przy użyciu języka Python
- Author(s):
- Release date: July 2020
- Publisher(s): APN Promise
- ISBN: 9788375414264
You might also like
book
Zaawansowany Python. Jasne, zwięzłe i efektywne programowanie
Prostota języka Python pozwala szybko osiągnąć produktywność, ale oznacza to również, że często nie wykorzystujemy wszystkiego, …
book
Python. Leksykon kieszonkowy. Wydanie V
Podr?czny przewodnik po j?zyku Python! J?zyk Python obecny jest na rynku od ponad 20 lat. Opracowany …
book
Python. Receptury. Wydanie III
Python to j?zyk programowania z ponad 20-letni? histori?. Opracowany na pocz?tku lat 90. ubieg?ego wieku, b?yskawicznie …
book
Python Rusz głową! Wydanie II
Python, prosty, wszechstronny i elastyczny język programowania, nadaje się zarówno do pisania niedużych skryptów, wielkich systemów, …