Chapitre 9. Graphes de chevauchement : Assemblage de séquences à l'aide de K-mères partagées
Un graphe est une structure utilisée pour représenter des relations par paires entre des objets. Comme décrit dans le défi Rosalind GRPH, le but de cet exercice est de trouver des paires de séquences qui peuvent être jointes en utilisant un chevauchement de la fin d'une séquence au début d'une autre. L'application pratique de ceci serait de joindre de courtes lectures d'ADN dans des séquences contiguës plus longues(contigs) ou même des génomes entiers. Pour commencer, je ne m'intéresserai qu'à l'assemblage de deux séquences, mais une deuxième version du programme utilisera une structure de graphe qui peut assembler n'importe quel nombre de séquences pour obtenir un assemblage complet. Dans cette implémentation, les régions de chevauchement utilisées pour assembler les séquences doivent être des correspondances exactes. Les assembleurs du monde réel doivent permettre une variation de la taille et de la composition des séquences qui se chevauchent.
Tu apprendras :
-
Comment utiliser les k-mères pour créer des graphes de chevauchement.
-
Comment enregistrer les messages d'exécution dans un fichier
-
Comment l'utiliser
collections.defaultdict() -
Comment utiliser l'intersection d'ensembles pour trouver des éléments communs entre des collections.
-
Comment utiliser ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access