Capítulo 8. Encuentra un motivo en el ADN: Explorando la similitud de secuencias
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
En el reto SUBS de Rosalind, buscaré cualquier aparición de una secuencia dentro de otra. Una subsecuencia compartida podría representar un elemento conservado, como un marcador, un gen o una secuencia reguladora. Las secuencias conservadas entre dos organismos podrían sugerir algún rasgo heredado o convergente.
Exploraré cómo escribir una solución utilizando la clase str
(cadena) en Python y compararé las cadenas con las listas. Luego exploraré cómo expresar estas ideas utilizando funciones de orden superior y continuaré la discusión sobre los k-mers que inicié en el Capítulo 7. Por último, mostraré cómo las expresiones regulares pueden encontrar patrones y señalaré los problemas con las coincidencias solapadas.
En este capítulo te lo demostraré:
-
Cómo utilizar
str.find()
,str.index()
, y los cortes de cadena -
Cómo utilizar conjuntos para crear colecciones únicas de elementos
-
Cómo combinar funciones de orden superior
-
Cómo encontrar subsecuencias utilizando k-mers
-
Cómo encontrar secuencias posiblemente solapadas utilizando expresiones regulares
Cómo empezar
El código y las pruebas de este capítulo están en 08_subs.Te sugiero que empieces copiando la primera solución en el programa subs.py
y pidas ayuda:
$ cd 08_subs/ $ cp solution1_str_find.py subs.py $ ./subs.py -h usage: ...
Get Dominar Python para Bioinformática now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.