IPEEC - CENPAT   25619
INSTITUTO PATAGONICO PARA EL ESTUDIO DE LOS ECOSISTEMAS CONTINENTALES
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Evaluación empírica de un protocolo para el ensamble de datos genómicos obtenidos mediante ddRADseq
Autor/es:
SITES JR., J. W.; AVILA, LUCIANO J.; MORANDO, MARIANA; SÁNCHEZ, KEVIN I.; LEACHÉ, A.D.
Lugar:
Puerto Madryn
Reunión:
Jornada; 9na Jornada de Becarixs CCT CONICET-CENPAT y 1er encuentro Patagónico de Becarixs; 2019
Institución organizadora:
CCT CONICET-CENPAT
Resumen:
La secuenciación de fragmentos de ADN asociado a fragmentos de restricción (RADseq) está siendo cada vez más empleada en estudios poblacionales y filogenéticos puesto que permite la obtención de cientos a miles de loci, lo que es ventajoso en situaciones en donde los marcadores tradicionalmente empleados arrojan resultados ambiguos. Sin embargo, la robustez de las inferencias realizadas depende de un cuidadoso procesamiento bioinformático de los datos (ej. remoción de regiones parálogas). Un desafío metodológico clave es determinar el porcentaje de similitud a partir del cual dos alelos son considerados homólogos y por ende son agrupados en el mismo locus (umbral de similitud). Este umbral define la divergencia máxima permitida entre variantes alélicas y la divergencia mínima entre posibles parálogos, y por ende es central para los análisis posteriores. En este trabajo pusimos a prueba un conjunto de métricas para determinar los umbrales de similitud entre secuencias que maximizan la remoción correcta de regiones parálogas, y minimizan la separación incorrecta de variantes alélicas distantes en diferentes loci. Para ello se ensamblaron loci empleando diferentes valores de este parámetro y se observaran atributos tales como: número de regiones parálogas identificadas, número de SNPs recuperados, proporción de heterocigosis, variabilidad explicada, correlación entre divergencia genética y falta de datos y resolución filogenética. Probamos este enfoque en un conjunto de datos genómicos de lagartijas del grupo Liolaemus kingii obtenidos mediante ddRADseq. Las métricas infieren un patrón de aproximadamente 90% de similitud entre alelos del mismo loci, como un umbral por encima del cual la divergencia genética y la falta de datos se correlacionan de manera creciente. Este protocolo posibilita una selección objetiva de parámetros, a la vez que es aplicable a cualquier sistema biológico tanto modelo como no modelo (cuando no se dispone de un genoma de referencia