Book description
Rosnąca dostępność danych sprawiła, że data science i uczenie maszynowe są powszechnie używane do przeróżnych celów. Równocześnie wiele osób pomija analizy matematyczne przed rozpoczęciem przetwarzania danych. A to wiąże się z ryzykiem popełnienia istotnych błędów już na etapie projektowania danego systemu. Dopiero dogłębne zrozumienie niektórych koncepcji matematycznych i umiejętność ich praktycznego zastosowania sprawia, że kandydat na analityka danych ma szansę osiągnąć poziom profesjonalisty.
To książka przeznaczona dla osób, które chcą dobrze zrozumieć matematyczne podstawy nauki o danych i nauczyć się stosowania niektórych koncepcji w praktyce. Wyjaśniono tu takie zagadnienia jak rachunek różniczkowy i całkowy, rachunek prawdopodobieństwa, algebra liniowa i statystyka, pokazano także, w jaki sposób posługiwać się nimi w regresji liniowej, regresji logistycznej i w tworzeniu sieci neuronowych. Poszczególne tematy zostały omówione zrozumiale, przystępnie, bez naukowego żargonu, za to z licznymi praktycznymi przykładami, co dodatkowo ułatwia przyswojenie koncepcji i prawideł matematyki. Opanowanie zawartej tu wiedzy pozwala uniknąć wielu kosztownych błędów projektowych i trafniej wybierać optymalne rozwiązania!
Dzięki książce nauczysz się:
używać kodu Pythona i jego bibliotek do eksplorowania koncepcji matematycznych
posługiwać się regresją liniową i regresją logistyczną
opisywać dane metodami statystycznymi i testować hipotezy
manipulować wektorami i macierzami
łączyć wiedzę matematyczną z użyciem modeli regresji
unikać typowych błędów w stosowaniu matematyki w data science
Zrozum matematykę i efektywnie używaj danych!
Table of contents
- Przedmowa
- Rozdział 1. Podstawy matematyki oraz rachunku różniczkowego i całkowego
- Rozdział 2. Prawdopodobieństwo
-
Rozdział 3. Statystyka opisowa i wnioskowanie statystyczne
- Czym są dane?
- Statystyka opisowa a wnioskowanie statystyczne
- Populacje, próby i obciążenie
- Statystyka opisowa
- Wnioskowanie statystyczne
- Rozkład t: analizowanie małych prób
- Big data i błąd teksańskiego snajpera
- Podsumowanie
- Ćwiczenia
- Rozdział 4. Algebra liniowa
-
Rozdział 5. Regresja liniowa
- Podstawowa regresja liniowa
- Reszty i kwadraty błędu
- Znajdowanie najlepiej dopasowanej linii
- Nadmierne dopasowanie i wariancja
- Metoda stochastycznego gradientu prostego
- Współczynnik korelacji
- Istotność statystyczna
- Współczynnik determinacji
- Błąd standardowy estymacji
- Przedziały przewidywania
- Podział danych na treningowe i testowe
- Wielokrotna regresja liniowa
- Podsumowanie
- Ćwiczenia
-
Rozdział 6. Regresja logistyczna i klasyfikacja
- Na czym polega regresja logistyczna?
- Przeprowadzanie regresji logistycznej
- Regresja logistyczna z wieloma zmiennymi
- Logarytm szansy
- R-kwadrat
- Wartości p
- Podziały na dane treningowe i testowe
- Macierz błędów
- Twierdzenie Bayesa a klasyfikacja
- Krzywa ROC/pole pod krzywą
- Nierównowaga klas
- Podsumowanie
- Ćwiczenia
- Rozdział 7. Sieci neuronowe
- Rozdział 8. Porady zawodowe i droga naprzód
-
Dodatek A. Tematy dodatkowe
- LaTeX w SymPy
- Rozkład dwumianowy od podstaw
- Rozkład beta od podstaw
- Wyprowadzenie twierdzenia Bayesa
- Dystrybuanta i dystrybuanta odwrotna od podstaw
- Używanie liczby e do przewidywania prawdopodobieństwa zdarzenia z biegiem czasu
- Wspinaczka i regresja liniowa
- Wspinaczka i regresja logistyczna
- Krótkie wprowadzenie do programowania liniowego
- Klasyfikator MNIST używający pakietu scikit-learn
- Dodatek B. Odpowiedzi do ćwiczeń
Product information
- Title: Podstawy matematyki w data science
- Author(s):
- Release date: March 2023
- Publisher(s): Helion
- ISBN: 9788383220147
You might also like
book
Statystyka praktyczna w data science
Metody statystyczne są kluczowym narzędziem w data science, mimo to niewielu analityków danych zdobyło wykształcenie w …
book
Data science od podstaw
Analityka danych jest uważana za wyjątkowo obiecującą dziedzinę wiedzy. Rozwija się błyskawicznie i znajduje coraz to …
book
Data science od podstaw
W tym przewodniku opisano zagadnienia związane z podstawami nauki o danych. Wyjaśniono niezbędne elementy matematyki i …
book
Zaawansowana analiza danych w PySpark
Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród …