Kapitel 6. Bioinformatik-Daten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bis jetzt haben wir viele der Vorbereitungen für den Einstieg in die Bioinformatik behandelt: das Organisieren eines Projektverzeichnisses, Unix als Zwischenstufe, die Arbeit mit entfernten Rechnern und die Versionskontrolle. Eine wichtige Komponente eines neuen Bioinformatikprojekts haben wir jedoch außer Acht gelassen: die Daten.

Daten sind eine Voraussetzung für jedes Bioinformatikprojekt. Wir verbessern unser Verständnis komplexer biologischer Systeme, indem wir eine große Menge an Daten so weit verfeinern, dass wir eine Bedeutung daraus ziehen können. Leider sind viele Aufgaben, die bei kleinen oder mittelgroßen Datensätzen einfach sind, bei den großen und komplexen Datensätzen, die in der Genomik üblich sind, eine Herausforderung. Zu diesen Herausforderungen gehören:

Daten abrufen

Egal, ob du große Sequenzierungsdatensätze herunterlädst oder hunderte Male auf eine Webanwendung zugreifst, um bestimmte Dateien herunterzuladen - das Abrufen von Daten in der Bioinformatik kann spezielle Tools und Fähigkeiten erfordern.

Sicherstellung der Datenintegrität

Die Übertragung großer Datensätze über Netzwerke schafft mehr Möglichkeiten für Datenverfälschungen, die später zu falschen Analysen führen können. Deshalb müssen wir die Datenintegrität mit Tools sicherstellen, bevor wir mit der Analyse fortfahren. Die gleichen ...

Get Bioinformatik Datenkenntnisse now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.