Capítulo 9. Grafos de solapamiento: Ensamblaje de secuencias mediante K-mers compartidos
Este trabajo se ha traducido utilizando IA. Agradecemos tus opiniones y comentarios: translation-feedback@oreilly.com
Un grafo es una estructura utilizada para representar relaciones de pares entre objetos. Como se describe en el reto GRPH de Rosalind, el objetivo de este ejercicio es encontrar pares de secuencias que puedan unirse utilizando un solapamiento desde el final de una secuencia hasta el principio de otra. La aplicación práctica de esto sería unir lecturas cortas de ADN en secuencias contiguas más largas(contigs) o incluso genomas completos. Para empezar, sólo me ocuparé de unir dos secuencias, pero una segunda versión del programa utilizará una estructura gráfica que puede unir cualquier número de secuencias para aproximarse a un ensamblaje completo. En esta implementación, se requiere que las regiones solapadas utilizadas para unir secuencias sean coincidencias exactas. Los ensambladores del mundo real deben permitir variaciones en el tamaño y la composición de las secuencias solapadas .
Aprenderás:
-
Cómo utilizar k-mers para crear gráficos de solapamiento
-
Cómo registrar mensajes de tiempo de ejecución en un archivo
-
Cómo utilizarlo
collections.defaultdict()
-
Cómo utilizar la intersección de conjuntos para encontrar elementos comunes entre colecciones
-
Cómo utilizar
itertools.product()
para crear productos cartesianos de listas -
Cómo utilizar la función
iteration_utilities.starfilter() ...
Get Dominar Python para Bioinformática now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.