INVESTIGADORES
FERNANDEZ Elmer Andres
congresos y reuniones científicas
Título:
Métodos multivariados para reconocer estructura genética poblacional a partir de genotipos moleculares
Autor/es:
ANDRE PEÑA MALAVERA; ELMER A FERNÁNDEZ; BALZARINI, MÓNICA
Lugar:
Salta
Reunión:
Congreso; XVI Reunion Científica Grupo Argentino de Biometría (GAB); 2011
Institución organizadora:
GAB
Resumen:
En programas de mejoramiento genético se analizan, mediante mapeo de asociación, sitios del ADN posiblemente asociados a caracteres de interés. Para implementarlo es necesario identificar posibles agrupamientos de las unidades de análisis producidos por similitudes/diferencias respecto a un gran número de marcadores moleculares (variables). Diferentes métodos multivariados, tanto estadísticos como bioinformáticos, pueden ser usados. En este trabajo evaluamos el desempeño de aplicaciones de conglomerados jerárquicos (UPGMA y Ward), conglomerados no-jerárquicos (k-means), método bayesiano basado en cadenas de Markov (Structure), método de data mining basado en redes neuronales (RP-Q-SOM) y análisis basado en autovectores (PCA) respecto a su capacidad para detectar la estructura genética subyacente bajo distintos escenarios. Se simularon 10 escenarios con el programa QMSim, en cada uno se generaron entre 130 y 180 individuos con información molecular de 10 cromosomas con 30 marcadores cada uno (300 variables por individuo). Los escenarios contemplaron diferente número de subpoblaciones (3 y 5) y diferentes niveles de divergencia entre ellas producido por distinto número de generaciones de cruzamientos aleatorio a partir de una población fundadora. Los resultados sugieren que todos los métodos permiten identificar la estructura poblacional simulada con un nivel de separabilidad alto indicado por un valor del índice Fst > 0,05. Con menor diferenciación entre grupos y/o mayor número de grupos, la identificación de conglomerados es pobre. No obstante, los algoritmos Bayesiano del programa STRUCTURE, RP-Q-SOM y k-means, en ese orden, fueron los de mejor desempeño, arrojando errores de clasificación menores a 30% para escenarios con divergencia media.