INVESTIGADORES
FERNANDEZ Elmer Andres
artículos
Título:
Análisis de conglomerados en la identificación de estructura genética a partir de datos de marcadores moleculares
Autor/es:
ANDRE PEÑA MALAVERA; BRUNO, CECILIA; INGRID TEICH; FERNÁNDEZ, ELMER ANDRÉS; BALZARINI, MÓNICA
Revista:
TUMBAGA
Editorial:
Universidad de Tolima
Referencias:
Año: 2010 vol. 1 p. 225 - 237
ISSN:
1909-4841
Resumen:
Resumen. En el contexto de abundante información genómica, como la producida a
partir de marcadores moleculares basados en ADN, es de interés identificar la estruc-
tura genética subyacente en un conjunto de individuos, previo al análisis de asociación
entre expresión de marcadores y fenotipo. Cuando existen subgrupos de individuos
que difieren sistemáticamente en las frecuencias alélicas de sus marcadores, se origina
una estructura genética que, de no ser considerada, incrementa el riesgo de detectar
asociaciones espurias entre marcadores y fenotipo. Diversos métodos estadísticos son
utilizados para determinar la agrupación de individuos desde datos de marcadores
moleculares que producen información discreta multidimensional, entre ellos mé-
todos basados en algoritmos de conglomerados jerárquicos (UPGMA), conglomera-
dos no jerárquicos (K-means), redes neuronales como los mapas auto-organizativos
(SOM) y métodos de conglomerados bayesianos. En este trabajo comparamos la ca-
pacidad de tales algoritmos para detectar subpoblaciones (conglomerados genéticos)
bajo dos escenarios biológicos de estructura poblacional: modelo de islas y modelo de
contacto. Los algoritmos de conglomerado fueron evaluados simultáneamente usando
conjuntos de datos de marcadores moleculares de expresión binaria simulados bajo
ambos modelos biológicos. El método de conglomeración bayesiano fue el que mejor
identificó, entre los evaluados, las subpoblaciones simuladas bajo el modelo de migra-
ción de islas. Para el modelo de contacto la identificación de subgrupos fue difícil con
cualquiera de los cuatro algoritmos de conglomeración evaluados.