PERSONAL DE APOYO
PEÑA MALAVERA Andrea Natalia
libros
Título:
Guía para la construcción de modelos de asociación genómica
Autor/es:
BRUNO CECILIA; VIDELA EUGENIA ; PEÑA ANDREA; BALZARINI MÓNICA
Editorial:
Editorial Brujas.
Referencias:
Año: 2019 p. 136
ISSN:
978-987-760-271-5
Resumen:
El mapeo asociativo (MA) o el estudio de asociación a través del genoma completo (GWAS por sus siglas en inglés, Genome Wide Association Study) es usado para identificar sitios específicos del genoma, marcados por un marcador molecular (MM), que deben interpretarse como asociados con la variación de un carácter fenotípico continuo. Este tipo de análisis de asociación genotipo-fenotipo puede ser implementado sobre colecciones o paneles de individuos o líneas diversas, i.e. con alta variabilidad genética. No es necesario generar poblaciones a partir de cruzamientos experimentales, pero sí conformar una población de mapeo (usualmente más de 120 individuos) de varios individuos genéticamente diferentes. Suelen usarse cientos o miles de marcadores moleculares para expresar la variabilidad genómica siendo la cantidad de MM generalmente mayor a la cantidad de líneas que conforman la población de mapeo. Las variantes genéticas identificadas mediante GWAS pueden explicar distinta proporción de la variación fenotípica y estar ligadas a uno o mas loci que determinan el carácter cuantitativo (QTL por sus siglas en inglés, Quantitative Trait Loci). El MA ofrece una oportunidad para identificar polimorfismos asociados con fenotipos de interés y para comprender la base genética de la variación cuantitativa de los caracteres fenotípicos. La alta dimensionalidad de la matriz de MM y las posibles estructuras o patrones en esta matriz, indicando estructura genética o falta de independencia entre los individuos de la población de mapeo, imprimen desafíos estadísticos para la evaluación de la significancia de las asociaciones marcador-fenotipo. Los modelos estadísticos más usados en MA son los modelos lineales mixtos (MLM) (West et al., 2014), desarrollados para estimar el efecto de cada marcador sobre el fenotipo. Sin embargo, otros efectos, principalmente aquellos relacionados a la estructura genética poblacional (EGP), deben ser considerados también en el modelo estadístico de MA. Si el fenotipado se ha realizado en varios ambientes, entonces los efectos de ambiente y de interacción entre genotipo y ambiente, también serán incluidos en los modelos que evalúan la asociación. Numerosos métodos estadísticos han sido desarrollados para contemplar la EGP en el modelo de MA (Malavera et al., 2018). Estos tienen como objetivo controlar los errores que podrían provenir de posibles asociaciones espurias o infladas al usar un modelo de asociación que supone independencia cuando existe estructura poblacional. Se supone que la modelación estadística que incorpora información sobre correlaciones entre los datos hace más eficiente el MA.En este texto se describen modelos de asociación que permiten realizar GWAS en paneles de líneas diversas, aún cuando éstas se encuentran estructuradas genéticamente. Para evitar falsos descubrimientos de asociaciones se trabaja primero identificando la estructura genética subyacente en la población de mapeo y luego incorporando la información de correlación entre líneas en los modelos. Adicionalmente, se controla la inflación de la tasa de falsos positivos debida a la inferencia simultánea o multiplicidad de prueba estadísticas que deben realizarse en estudios de asociación con muchos MM. Para facilitar el ajuste de estos modelos se describe el nuevo menú de MA embebido en el software para análisis de datos genéticos Info-Gen (Balzarini y Di Rienzo, 2018) y códigos para implementar cada uno de los procedimientos estadísticos descriptos, tanto para el análisis de EGP como para MA, usando el software R (www.R-org.com). En la última parte de este documento se ilustra cómo trabajar directamente en Info-Gen y cómo ejecutar scripts de R desde el intérprete de R disponible en Info-Gen.