INVESTIGADORES
BICH Gustavo Angel
congresos y reuniones científicas
Título:
ENSAMBLADO DEL GENOMA DE TRICHODERMA KONINGIOPSIS POS7. COMPARACIÓN DE LOS ENSAMBLADORES VELVET Y SPADES
Autor/es:
CASTRILLO, ML; BICH G. A.; ZAPATA PD; SAPARRAT MCN; VILLALBA LL
Lugar:
Posadas
Reunión:
Jornada; JORNADAS CIENTÍFICAS TECNOLÓGICAS - 45 ANIVERSARIO DE LA UNAM Y CENTENARIO REFORMA UNIVERSITARIA.; 2018
Resumen:
La secuenciación del genoma se basa en fragmentar todo el genoma al azar y secuenciar cada fragmento independientemente. El ensamblaje del genoma es el proceso de unir los fragmentos de ADN en secuencias de mayor longitud. El proceso de ensamblaje consta de tres fases: limpieza de secuencias, alineamiento de secuencias y ensamblaje propiamente dicho. Para realizar el proceso de ensamblado de genomas lo más común es utilizar tecnologías de computación paralela debido al gran número de datos que se generan y se deben procesar. Los programas de ensamblado para UNIX como Velvet y Spades son ampliamente utilizados para ensamblar genomas fúngicos de novo. En ellos el parámetro k-mers está implicado en la sensibilidad y especificidad del ensamblado. Para evitar errores en este proceso hay que considerar la similitud y longitud de la región solapada de cada secuencia, el porcentaje de la secuencia que se solapa y se deben ignorar las secuencias que solapan con muchas otras secuencias (secuencias repetitivas). Considerando todo lo expuesto, se propuso como objetivo general del trabajo evaluar la calidad del ensamblado del genoma de Trichoderma koningiopsis POS7 mediante Velvet y Spades. El genoma del aislamiento T. koningiopsis POS7 se secuenció mediante la Tecnología Ilumina MiSeq y se generó una biblioteca Rapid Shotgun para ADN genómico. Los paired end reads obtenidos fueron filtrados y se ensamblaron mediante Velvet 1.1 y Spades 3.10.1 con diferentes k-mers. Velvet permite evaluar k-mers con valores impares inferiores a la longitud Maxkmerhash (31 pb para 64 bits) por tanto se computaron los valores: 21, 23, 25, 27 y 29. Spades evalúa por defecto 3 k-mers: 21, 33 y 55. Sin embargo, al considerarse que aproximadamente un 60% de la longitud de los reads puede solaparse, se computaron además los k-mers: 57, 59, 61, 63, 65, 67, 69 y 71. La aplicación QUAST (Quality Assessment Tool for Genome Assemblies), se utilizó para evaluar la calidad de los ensambladores mediante la determinación de distintos tipos de métricas.El proceso de secuenciado arrojó un total de 9.483.872 reads, a partir de los cuales se obtuvieron 7.773.936 reads filtrados de buena calidad. El mejor ensamblado se obtuvo con el ensamblador Spades con un k-mers de 71, con el cual se obtuvieron 248 cóntigos mayores a 500 pb con un N50 igual a 802.152 pb. En concordancia con lo reportado por otros autores para diferentes genomas, el ensamblador Spades fue el que permitió obtener el mejor ensamblado para el genoma de T. koningiopsis POS7. A partir de los 248 cóntigos obtenidos, se podrán enmascarar las regiones repetitivas del genoma y se anotará el mismo de manera estructural y funcional.Estas Jornadas se realizaron durante el llamado de la convocatoria a ingreso CIC, entre el 9 y 11 de Mayo. El libro de resúmenes lo publicarán mas adelante.