CONICET | Buscador de Institutos y Recursos Humanos

Resumen. En el contexto de abundante información genómica, como la producida a partir de marcadores moleculares basados en ADN, es de interés identificar la estruc- tura genética subyacente en un conjunto de individuos, previo al análisis de asociación entre expresión de marcadores y fenotipo. Cuando existen subgrupos de individuos que difieren sistemáticamente en las frecuencias alélicas de sus marcadores, se origina una estructura genética que, de no ser considerada, incrementa el riesgo de detectar asociaciones espurias entre marcadores y fenotipo. Diversos métodos estadísticos son utilizados para determinar la agrupación de individuos desde datos de marcadores moleculares que producen información discreta multidimensional, entre ellos mé- todos basados en algoritmos de conglomerados jerárquicos (UPGMA), conglomera- dos no jerárquicos (K-means), redes neuronales como los mapas auto-organizativos (SOM) y métodos de conglomerados bayesianos. En este trabajo comparamos la ca- pacidad de tales algoritmos para detectar subpoblaciones (conglomerados genéticos) bajo dos escenarios biológicos de estructura poblacional: modelo de islas y modelo de contacto. Los algoritmos de conglomerado fueron evaluados simultáneamente usando conjuntos de datos de marcadores moleculares de expresión binaria simulados bajo ambos modelos biológicos. El método de conglomeración bayesiano fue el que mejor identificó, entre los evaluados, las subpoblaciones simuladas bajo el modelo de migra- ción de islas. Para el modelo de contacto la identificación de subgrupos fue difícil con cualquiera de los cuatro algoritmos de conglomeración evaluados.

enviar mensaje