Chapitre 2. Transcription de l'ADN en ARNm : Mutation de chaînes de caractères, lecture et écriture de fichiers
Pour exprimer les protéines nécessaires au maintien de la vie, les régions de l'ADN doivent être transcrites en une forme d'ARN appelée ARN messager (ARNm ). Bien qu'il existe de nombreuses différences biochimiques fascinantes entre l'ADN et l'ARN, pour ce qui nous concerne, la seule différence est que tous les caractères T représentant la base thymine dans une séquence d'ADN doivent être remplacés par la lettre U, pour uracile.
Comme décrit sur la page de l'ARN de Rosalind, le programme que je vais te montrer comment écrire acceptera une chaîne d'ADN comme ACGT et imprimera l'ARNm transcrit ACGU. Je peux utiliser la fonction str.replace() de Python pour accomplir cela en une seule ligne :
>>> 'GATGGAACTTGACTACGTAAATT'.replace('T', 'U')
'GAUGGAACUUGACUACGUAAAUU'
Tu as déjà vu au chapitre 1 comment écrire un programme qui accepte une séquence d'ADN à partir de la ligne de commande ou d'un fichier et qui imprime un résultat, tu n'apprendras donc pas grand-chose si tu recommences. Je vais rendre ce programme plus intéressant en m'attaquant à un schéma très courant en bioinformatique. Je vais en effet montrer comment traiter un ou plusieurs fichiers d'entrée et placer les résultats dans un répertoire de sortie. Par exemple, il est assez courant ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access