Book description
Analityka danych jest uważana za wyjątkowo obiecującą dziedzinę wiedzy. Rozwija się błyskawicznie i znajduje coraz to nowsze zastosowania. Profesjonaliści biegli w eksploracji danych i wydobywaniu z nich pożytecznych informacji mogą liczyć na interesującą pracę i bardzo atrakcyjne warunki zatrudnienia. Jednak aby zostać analitykiem danych, trzeba znać matematykę i statystykę, a także nauczyć się programowania. Umiejętności w zakresie uczenia maszynowego i uczenia głębokiego również są ważne. W przypadku tak specyficznej dziedziny, jaką jest nauka o danych, szczególnie istotne jest zdobycie gruntownych podstaw i dogłębne ich zrozumienie.
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i statystyki. Przedstawiono także techniki budowy potrzebnych narzędzi i sposoby działania najistotniejszych algorytmów. Książka została skonstruowana tak, aby poszczególne implementacje były jak najbardziej przejrzyste i zrozumiałe. Zamieszczone tu przykłady napisano w Pythonie: jest to język dość łatwy do nauki, a pracę na danych ułatwia szereg przydatnych bibliotek Pythona. W drugim wydaniu znalazły się nowe tematy, takie jak uczenie głębokie, statystyka i przetwarzanie języka naturalnego, a także działania na ogromnych zbiorach danych. Zagadnienia te często pojawiają się w pracy współczesnego analityka danych.
W książce między innymi:
elementy algebry liniowej, statystyki i rachunku prawdopodobieństwa
zbieranie, oczyszczanie i eksploracja danych
algorytmy modeli analizy danych
podstawy uczenia maszynowego
systemy rekomendacji i przetwarzanie języka naturalnego
analiza sieci społecznościowych i algorytm MapReduce
Nauka o danych: bazuj na solidnych podstawach!
Table of contents
- Przedmowa do drugiego wydania
- Przedmowa do pierwszego wydania
- Rozdział 1. Wprowadzenie
-
Rozdział 2. Błyskawiczny kurs Pythona
- Zasady tworzenia kodu Pythona
- Skąd wziąć interpreter Pythona?
- Środowiska wirtualne
- Formatowanie za pomocą białych znaków
- Moduły
- Polskie znaki diakrytyczne
- Funkcje
- Łańcuchy
- Wyjątki
- Listy
- Krotki
- Słowniki
- Counter
- Zbiory
- Przepływ sterowania
- Wartości logiczne
- Sortowanie
- Składanie list
- Testy automatyczne i instrukcja assert
- Programowanie obiektowe
- Obiekty iterowalne i generatory
- Losowość
- Wyrażenia regularne
- Narzędzia funkcyjne
- Funkcja zip i rozpakowywanie argumentów
- Argumenty nazwane i nienazwane
- Adnotacje typów
- Witaj w firmie DataSciencester!
- Dalsza eksploracja
- Rozdział 3. Wizualizacja danych
- Rozdział 4. Algebra liniowa
- Rozdział 5. Statystyka
- Rozdział 6. Prawdopodobieństwo
- Rozdział 7. Hipotezy i wnioski
- Rozdział 8. Metoda gradientu prostego
- Rozdział 9. Uzyskiwanie danych
- Rozdział 10. Praca z danymi
- Rozdział 11. Uczenie maszynowe
- Rozdział 12. Algorytm k najbliższych sąsiadów
- Rozdział 13. Naiwny klasyfikator bayesowski
- Rozdział 14. Prosta regresja liniowa
- Rozdział 15. Regresja wieloraka
- Rozdział 16. Regresja logistyczna
- Rozdział 17. Drzewa decyzyjne
- Rozdział 18. Sztuczne sieci neuronowe
-
Rozdział 19. Uczenie głębokie
- Tensor
- Abstrakcja Layer
- Warstwa Linear
- Sieci neuronowe jako sekwencje warstw
- Abstrakcja Loss i optymalizacja
- Przykład: kolejne podejście do bramki XOR
- Inne funkcje aktywacji
- Przykład: kolejne podejście do gry Fizz Buzz
- Funkcja softmax i entropia krzyżowa
- Dropout
- Przykład: MNIST
- Zapisywanie i wczytywanie modeli
- Dalsza eksploracja
- Rozdział 20. Grupowanie
- Rozdział 21. Przetwarzanie języka naturalnego
- Rozdział 22. Analiza sieci społecznościowych
- Rozdział 23. Systemy rekomendujące
- Rozdział 24. Bazy danych i SQL
- Rozdział 25. Algorytm MapReduce
-
Rozdział 26. Etyka przetwarzania danych
- Czym jest etyka danych?
- Ale tak naprawdę to czym jest etyka danych?
- Czy powinienem przejmować się etyką danych?
- Tworzenie złych produktów wykorzystujących dane
- Kompromis między dokładnością a uczciwością
- Współpraca
- Interpretowalność
- Rekomendacje
- Tendencyjne dane
- Ochrona danych
- Podsumowanie
- Dalsza eksploracja
- Rozdział 27. Praktyka czyni mistrza
Product information
- Title: Data science od podstaw
- Author(s):
- Release date: February 2020
- Publisher(s): Helion
- ISBN: 9788383221328
You might also like
book
Data science od podstaw
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i …
book
Statystyka praktyczna w data science
Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w …
book
Podstawy matematyki w data science
Rosnąca dostępność danych sprawiła, że data science i uczenie maszynowe są powszechnie używane do przeróżnych celów. …
book
Zaawansowana analiza danych w PySpark
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród …