Capítulo 6. Datos bioinformáticos

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Hasta ahora, hemos cubierto muchos de los preliminares para iniciarse en la bioinformática: organizar un directorio de proyecto, Unix intermedio, trabajar con máquinas remotas y utilizar el control de versiones. Sin embargo, hemos ignorado un componente importante de un nuevo proyecto bioinformático: los datos.

Los datos son un requisito de cualquier proyecto bioinformático. Avanzamos en nuestra comprensión de los sistemas biológicos complejos refinando una gran cantidad de datos hasta un punto en el que podamos extraer significado de ellos. Por desgracia, muchas tareas que resultan sencillas con conjuntos de datos pequeños o medianos son un reto con los conjuntos de datos grandes y complejos habituales en genómica. Estos retos incluyen:

Recuperar datos

Ya sea descargando grandes conjuntos de datos de secuenciación o accediendo cientos de veces a una aplicación web para descargar archivos específicos, la recuperación de datos en bioinformática puede requerir herramientas y habilidades especiales.

Garantizar la integridad de los datos

La transferencia de grandes conjuntos de datos a través de las redes crea más oportunidades de corrupción de los datos, lo que más tarde puede dar lugar a análisis incorrectos. En consecuencia, debemos garantizar la integridad de los datos con herramientas antes de continuar con el análisis. Las ...

Get Habilidades en Datos Bioinformáticos now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.