INVESTIGADORES
VILLALBA Pamela Victoria
congresos y reuniones científicas
Título:
Biotecnología y mejoramiento agropecuario y forestal: simulMGF, un paquete de R para simular datos genómicos, fenotípicos y efectos genotípicos.
Autor/es:
GARCIA, MARTÍN N.; AGUIRRE, NATALIA C.; RIVAS, JUAN G.; VILLALBA, PAMELA V.; ACUÑA, CINTIA V.; MARTINEZ, M. CAROLINA; MARCUCCI POLTRI, SUSANA N.
Reunión:
Simposio; XIV SIMPOSIO REDBIO ARGENTINA; 2023
Resumen:
En la era de la generación de datos masivos tanto genotípicos (miles de marcadoresmoleculares) como fenotípicos (caracteres simples y caracteres cuantitativos) esnecesario disponer de materiales para la comunicación y la educación de manerapráctica e interactiva en el ámbito de la enseñanza universitaria. simulMGF es unaherramienta de modelado de la arquitectura genética de caracteres cuantitativosrelevante para la formación en genética cuantitativa moderna (GCM) y parasimulaciones de programas de mejoramiento genético (PMG), de especies de interésagropecuario y forestal.El paquete de R simulMGF (disponible en https://CRAN.R-project.org/package=simulMGF), asume un modelo cuantitativo puro, segregaciónmendeliana y especies diploides, cuenta con seis funciones:● simGeno: simula genotipos en matrices de SNP (Single NucleotidePolymorphisms) como valores aleatorios desde una distribución uniforme, paraorganismos diploides (codificados por 0, 1 y 2; donde 0 y 2 son los homocigotas y 1 elheterocigota).● simPheno: simula un fenotipo desde una matriz de SNP con loci de caracterescuantitativos (QTLs) con efectos muestreados desde una distribución Normal.● simulFS: simula los genotipos de progenies de hermanos completos desde elgenotipo de los parentales.● simulHS: simula los genotipos de progenies de medios hermanos desde elgenotipo de un parental.● simulN: simula una matriz de SNP y caracteres controlados por determinadonúmero de QTLs y sus efectos muestreados desde una distribución Normal.● simulU: ídem simulN pero muestrea efectos desde una distribución Uniforme.En comparación el paquete PhenotypeSimulator tiene algunas similitudes (simulaciónde matriz de SNP aunque con diferente criterio estadístico, simulación de fenotipos y deefectos genotípico) pero tiene varias limitaciones como ser el gran número deparámetros en sus funciones que lo vuelven poco amigable y, lo que es más importante,no permite simular relaciones entre individuos basadas en la segregación mendelianade alelos, lo cual es fundamental en todo PMG.Este trabajo ilustra la aplicación del paquete simulMGF con ejemplos utilizando cincomodelos de mapeo de asociación que difieren en poder estadístico (GLM, MLM, SUPER, MLMM, FarmCPU y Blink) y cuatro metodologías de selección genómica: dosparamétricas (Ridge Regression” y “LASSO bayesiano”) y dos no paramétricas (RandomForest y Reproducing kernel Hilbert space).Para la formación del estudiante de agrobiotecnología, biología y agronomía simulMGFcontribuye a desarrollar una mayor comprensión de las herramientas empleadas parael estudio de los caracteres cuantitativos y para la selección de individuos en PMG. Enlos PMG (para mejoradores/investigadores) o en la práctica de la GCM, permitecomprobar el poder estadístico de distintos modelos y sobre esa base realizar la eleccióndel modelo a aplicar (ya sean estudios de mapeo por asociación o modelos de seleccióngenómica) para caracteres de diferente complejidad.