Skip to Content
Praktisches Python Data Wrangling und Datenqualität
book

Praktisches Python Data Wrangling und Datenqualität

by Susan E. McGregor
September 2024
Intermediate to advanced
416 pages
13h 8m
German
O'Reilly Media, Inc.
Book available
Content preview from Praktisches Python Data Wrangling und Datenqualität

Anhang C. Daten finden

Im Allgemeinen gibt es auf vier "Quellen" für Daten, auf die du zurückgreifen kannst, wenn du versuchst, eine Frage über die Welt zu beantworten. Ich setze "Quellen" in Anführungszeichen, weil es sich dabei wirklich um Quellen handelt und nicht um bestimmte Websites, Datenbanken oder sogar Organisationen. Stattdessen handelt es sich um die Mechanismen, die Journalisten, Forscher und andere Fachleute nutzen, um Daten über die Welt zu sammeln, um ihre Fragen zu beantworten.

Datenarchive und APIs

Der Zugang zu "offenen Daten" ist zunehmend ein Merkmal vieler staatlicher und wissenschaftlicher Organisationen geworden, um die Transparenz, Rechenschaftspflicht und - vor allem in der Wissenschaft - die Reproduzierbarkeit zu verbessern. Das bedeutet, dass viele Behörden, gemeinnützige Organisationen und wissenschaftliche Zeitschriften Webseiten unterhalten, auf denen du strukturierte Daten zu ihrer Arbeit finden kannst. Eine einfache Websuche nach "nyc open data" oder "baltimore open data" bringt dich zum Beispiel zu den "Open Data"-Portalen dieser Städte; eine ähnliche Suche nach "johannesburg open data" bringt dich zunächst zur Website des South African Cities Open Data Almanac (SCODA), aber ein paar Links weiter findest du weitere Datensätze von einer Organisation namens "DataFirst" sowie das South African Data Portal unter http://opendataforafrica.org. Auf all diesen Seiten findest du Daten - aber wie in Kapitel 3 beschrieben, kann die Qualität dieser Daten ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Python lernen, 5. Auflage

Python lernen, 5. Auflage

Mark Lutz
High Performance Python, 2. Auflage

High Performance Python, 2. Auflage

Micha Gorelick, Ian Ozsvald
Blaupausen für Textanalyse mit Python

Blaupausen für Textanalyse mit Python

Jens Albrecht, Sidharth Ramachandran, Christian Winkler

Publisher Resources

ISBN: 9781098194512Supplemental Content