Chapitre 8. Trouver un motif dans l'ADN : Explorer la similarité des séquences
Dans le cadre du défi Rosalind SUBS, je vais rechercher toutes les occurrences d'une séquence à l'intérieur d'une autre. Une sous-séquence partagée peut représenter un élément conservé tel qu'un marqueur, un gène ou une séquence régulatrice. Les séquences conservées entre deux organismes peuvent suggérer une caractéristique héritée ou convergente.
Je vais voir comment écrire une solution à l'aide de la classe str (string) de Python et je vais comparer les strings aux listes. Ensuite, je vais voir comment exprimer ces idées à l'aide de fonctions d'ordre supérieur et je vais poursuivre la discussion sur les k-mers que j'ai commencée au chapitre 7. Enfin, je vais montrer comment les expressions régulières peuvent trouver des motifs et je vais souligner les problèmes liés aux correspondances qui se chevauchent.
Dans ce chapitre, je vais te faire une démonstration :
-
Comment utiliser
str.find(),str.index(), et les tranches de chaîne -
Comment utiliser les ensembles pour créer des collections uniques d'éléments ?
-
Comment combiner des fonctions d'ordre supérieur
-
Comment trouver des sous-séquences à l'aide de k-mers
-
Comment trouver des séquences qui se chevauchent éventuellement à l'aide d'expressions régulières ?
Pour commencer
Le code et les tests de ce chapitre se ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Read now
Unlock full access