Skip to Main Content
Bioinformatik Datenkenntnisse
book

Bioinformatik Datenkenntnisse

by Vince Buffalo
September 2024
Intermediate to advanced content levelIntermediate to advanced
538 pages
17h 27m
German
O'Reilly Media, Inc.
Book available
Content preview from Bioinformatik Datenkenntnisse

Kapitel 11. Arbeiten mit Ausrichtungsdaten

Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com

In Kapitel 9 haben wir die Bereichsformate wie BED und GTF kennengelernt, die häufig verwendet werden, um genomische Bereichsdaten zu speichern, die mit genomischen Merkmalsannotationen wie Genmodellen verbunden sind. Andere bereichsbasierte Formate wurden für die Speicherung großer Mengen von Alignment-Daten entwickelt - zum Beispiel für die Ergebnisse des Alignments von Millionen (oder Milliarden) von Sequenzierungs-Reads mit hohem Durchsatz an einem Genom. In diesem Kapitel befassen wir uns mit dem am weitesten verbreiteten Format für das Alignment von Hochdurchsatzdaten: dem SAM-Format (Sequence Alignment/Mapping) für Mapping-Daten (und seinem binären Pendant, BAM). Die Formate SAM und BAM sind die Standardformate für die Speicherung von Sequenzierungs-Reads, die auf eine Referenz gemappt werden.

Wir untersuchen SAM und BAM aus zwei Gründen. Erstens: Ein großer Teil der Bioinformatikarbeit besteht in der Bearbeitung von Alignment-Dateien. Nahezu jedes Hochdurchsatz-Sequenzierungsexperiment beinhaltet einen Alignment-Schritt, der Alignment-Daten im SAM/BAM-Format erzeugt. Da jeder Sequenzierungs-Read einen Alignment-Eintrag hat, sind die Alignment-Dateien riesig und erfordern platzsparende, komplexe Binärdateiformate. Außerdem geben moderne Aligner eine unglaubliche Menge an nützlichen Informationen ...

Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

Algorithmen lernen

Algorithmen lernen

George Heineman
Lernstrahl

Lernstrahl

Max Pumperla, Edward Oakes, Richard Liaw
Data-Science-Crashkurs

Data-Science-Crashkurs

Steffen Herbold
Praktische natürliche Sprachverarbeitung

Praktische natürliche Sprachverarbeitung

Sowmya Vajjala, Bodhisattwa Majumder, Anuj Gupta, Harshit Surana

Publisher Resources

ISBN: 9781098191375