Capítulo 8. Automatizar la ejecución de análisis con flujos de trabajo

Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com

Hasta ahora, hemos estado ejecutando comandos individuales manualmente en el terminal. Sin embargo, la inmensa mayoría del trabajo genómico propiamente dicho -el análisis secundario, en el que pasamos de los datos brutos a la información destilada que luego introduciremos en el análisis posterior para producir, en última instancia, conocimientos biológicos- implica ejecutar los mismos comandos en el mismo orden en todos los datos a medida que salen del secuenciador. Mira de nuevo los flujos de trabajo de Buenas prácticas de GATK descritos en los capítulos 6 y 7; imagina lo tedioso que sería hacer todo eso manualmente para cada muestra. A los recién llegados al campo a menudo les resulta beneficioso ejecutar paso a paso los comandos implicados en los datos de prueba, para hacerse una idea de los pasos clave, sus requisitos y sus peculiaridades -por eso te guiamos a través de todo eso en los Capítulos 6 y 7-, peroal fin y al cabo, vas a querer automatizar todo eso en la medida de lo posible. La automatización no sólo reduce la cantidad de tedioso trabajo manual que tienes que hacer, sino que también aumenta el rendimiento de tu análisis y reduce la posibilidad de que se produzcan errores humanos.

En este capítulo, cubrimos ese cambio de comandos individuales o scripts puntuales a flujos de trabajo ...

Get Genómica en la nube now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.