Skip to Content
Data-Science-Crashkurs
book

Data-Science-Crashkurs

by Steffen Herbold
January 2022
Intermediate to advanced
346 pages
9h
German
dpunkt
Content preview from Data-Science-Crashkurs

11Statistik

Im Laufe der Kapitel haben wir bereits einige Datensätze betrachtet. Einen wichtigen Aspekt haben wir aber bisher ignoriert: die Rolle des Zufalls, um Unterschiede zu erklären. Daher wollen wir uns an dieser Stelle noch mit Methoden aus der Statistik beschäftigen, die dazu geeignet sind, Aussagen darüber zu treffen, ob wir einen echten Effekt beobachten oder lediglich zufällige Schwankungen. Um zu verstehen, warum das relevant ist, betrachten wir direkt zwei Beispiele. In Kapitel 4 haben wir zum Beispiel die Verteilung von Daten mit Histogrammen visualisiert. Hier sind die Histogramme von zwei weiteren Datensätzen:

import numpy as np

import matplotlib.pyplot as plt

from scipy import stats

# generate data

np.random.seed(42)

mu, sigma ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Sketchnotes in der IT

Sketchnotes in der IT

Lisa Maria Moritz
Das DevOps-Handbuch

Das DevOps-Handbuch

Jez Humble, John Willis, Gene Kim, Patrick Debois
Projektmanagement kurz & gut

Projektmanagement kurz & gut

Daniel Brönimann, Christoph Bommer

Publisher Resources

ISBN: 9781098130343