Capítulo 14. Encontrar marcos de lectura abiertos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

El reto ORF es el último problema Rosalind que abordaré en este libro. El objetivo es encontrar todos los marcos de lectura abiertos (ORF) posibles en una secuencia de ADN. Un ORF es una región de nucleótidos entre el codón de inicio y el codón de parada. La solución tendrá en cuenta tanto el complemento directo como el inverso, así como los desplazamientos de marco. Aunque existen herramientas como TransDecoder para encontrar regiones codificantes, escribir una solución a medida reúne muchas habilidades de los capítulos anteriores, incluida la lectura de un archivo FASTA, la creación del complemento inverso de una secuencia, el uso de rebanadas de cadena, la búsqueda de k-mers, el uso de múltiples for bucles/iteraciones, la traducción del ADN y el uso de expresiones regulares.

Aprenderás:

  • Cómo truncar una secuencia hasta una longitud divisible por el tamaño de un codón

  • Cómo utilizar las funciones str.find() y str.partition()

  • Cómo documentar una expresión regular utilizando formato de código, comentarios y la concatenación implícita de cadenas de Python

Cómo empezar

El código, las pruebas y las soluciones de este reto se encuentran en el directorio 14_orf.Empieza copiando la primera solución en el programa orf.py:

$ cd 14_orf/
$ cp solution1_iterate_set.py orf.py

Si solicitas la utilización, verás que el ...

Get Dominar Python para Bioinformática now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.