Kapitel 9. Überlappungsgraphen: Sequenzzusammenbau mit geteilten K-mers
Diese Arbeit wurde mithilfe von KI übersetzt. Wir freuen uns über dein Feedback und deine Kommentare: translation-feedback@oreilly.com
Ein Graph ist eine Struktur, die verwendet wird, um paarweise Beziehungen zwischen Objekten darzustellen. Wie in der Rosalind GRPH-Herausforderung beschrieben, besteht das Ziel dieser Übung darin, Paare von Sequenzen zu finden, die durch eine Überlappung vom Ende einer Sequenz zum Anfang einer anderen verbunden werden können. Die praktische Anwendung wäre, kurze DNA-Reads zu längeren zusammenhängenden Sequenzen(Contigs) oder sogar ganzen Genomen zu verbinden. Zunächst geht es nur um das Zusammenfügen von zwei Sequenzen, aber eine zweite Version des Programms wird eine Graphenstruktur verwenden, die eine beliebige Anzahl von Sequenzen zusammenfügen kann, um eine vollständige Assemblierung anzunähern. In dieser Implementierung müssen die überlappenden Regionen, die zum Zusammenfügen von Sequenzen verwendet werden, exakt übereinstimmen. In der realen Welt müssen Assemblierer Variationen in der Größe und Zusammensetzung der überlappenden Sequenzen zulassen .
Du wirst lernen:
-
Wie man k-mers verwendet, um Überlappungsgraphen zu erstellen
-
So protokollierst du Laufzeitmeldungen in einer Datei
-
Wie man sie benutzt
collections.defaultdict()
-
Wie man die Schnittmenge von Mengen verwendet, um gemeinsame Elemente zwischen Sammlungen zu finden
-
Wie man mit
itertools.product()
kartesische ...
Get Python für die Bioinformatik beherrschen now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.