Kapitel 3. Effektive Nutzung von Datenstrukturen

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Im vorherigen Kapitel hast du gesehen, wie du die Leistung deines Codes messen kannst. In diesem Kapitel zeige ich dir, wie sich die Wahl der Datenstruktur auf die Leistung deines Codes auswirkt, und ich erkläre dir, wie du die beste Datenstruktur für das jeweilige Problem auswählst.

Wenn du als Data Scientist Code schreibst, musst du eine Vielzahl von Datenstrukturen verwenden, um deine Daten zu speichern. Du wirst viele Möglichkeiten haben, welche Datenstruktur du verwenden willst, und es ist wahrscheinlich, dass einige davon für das Problem, an dem du arbeitest, geeignet sind, während andere weniger gut geeignet sind.

...ein großer Teil der performanten Programmierung besteht darin, zu wissen, welche Fragen du deinen Daten stellen willst, und eine Datenstruktur zu wählen, die diese Fragen schnell beantworten kann.

Micha Gorelick und Ian Osvald, High Performance Python

Es ist wichtig, die richtige Datenstruktur für das Problem zu verwenden, an dem du arbeitest, und zwar aus zwei Gründen: Erstens ist die Datenstruktur für den jeweiligen Anwendungsfall optimiert, und zweitens sind nützliche Methoden mit ihr verbunden. Wenn du also die richtige Datenstruktur wählst, ist dein Code leistungsfähiger und einfacher zu bedienen. Das bedeutet auch, dass dein Code berechenbarer und leichter zu verstehen ...

Get Software Engineering für Datenwissenschaftler now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.