Kapitel 8. Automatisierung der Analyse-Ausführung mit Workflows

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

Bislang haben wir einzelne Befehle manuell im Terminal ausgeführt. Der überwiegende Teil der eigentlichen Genomikarbeit - die Sekundäranalyse, bei der wir aus den Rohdaten die Informationen destillieren, die wir dann in die nachgelagerte Analyse einspeisen, um letztendlich biologische Erkenntnisse zu gewinnen - erfordert jedoch die Ausführung der gleichen Befehle in der gleichen Reihenfolge für alle Daten, die den Sequenzer verlassen. Schau dir noch einmal die Workflows der bewährten Methoden von GATK an, die in den Kapiteln 6 und 7 beschrieben werden; stell dir vor, wie mühsam es wäre, das alles für jede Probe manuell zu machen. Für Neulinge ist es oft von Vorteil, die Befehle Schritt für Schritt mit Testdaten durchzugehen, um ein Gefühl für die wichtigsten Schritte, ihre Anforderungen und ihre Eigenheiten zu bekommen - deshalb haben wir dir das in den Kapiteln 6 und 7 erklärt -, aberletzten Endes willst du das alles so weit wie möglich automatisieren. Die Automatisierung verringert nicht nur den Umfang der mühsamen manuellen Arbeit, sondern erhöht auch den Durchsatz deiner Analyse und verringert die Möglichkeit menschlicher Fehler.

In diesem Kapitel befassen wir uns mit dem Wechsel von einzelnen Befehlen oder einmaligen Skripten zu wiederholbaren Workflows. Wir zeigen dir, wie du ...

Get Genomik in der Cloud now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.