Chapitre 14. Trouver des cadres de lecture ouverts
Le défi ORF est le dernier problème de Rosalind que j'aborderai dans ce livre. L'objectif est de trouver tous les cadres de lecture ouverts (ORF) possibles dans une séquence d'ADN. Un ORF est une région de nucléotides située entre le codon de départ et le codon d'arrêt. La solution prendra en compte à la fois le complément avant et le complément arrière, ainsi que les décalages de trame.
Bien qu'il existe des outils tels que TransDecoder pour trouver les régions codantes, l'écriture d'une solution sur mesure rassemble de nombreuses compétences des chapitres précédents, notamment la lecture d'un fichier FASTA, la création du complément inverse d'une séquence, l'utilisation de tranches de chaînes, la recherche de k-mères, l'utilisation de plusieurs boucles/itérations for, la traduction de l'ADN et l'utilisation d'expressions régulières.
Tu apprendras :
-
Comment tronquer une séquence à une longueur également divisible par la taille d'un codon ?
-
Comment utiliser les fonctions
str.find()etstr.partition()? -
Comment documenter une expression régulière en utilisant le formatage du code, les commentaires et la concaténation implicite de chaînes de Python.
Pour commencer
Le code, les tests et les solutions de ce défi se trouvent dans le répertoire 14_orf.Commence par copier la première solution dans ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access