BECAS
PARLANTI Tatiana SofÍa
congresos y reuniones científicas
Título:
Matemática aplicada a la Genética: Clusterización de Haplotipos
Autor/es:
PARLANTI, TATIANA SOFÍA; QUERO, GASTÓN; SIMONDI, SEBASTIÁN RICARDO
Lugar:
Mendoza
Reunión:
Jornada; IV Jornadas de Estudiantes de Ciencias Exactas y Naturales (IV JECEN); 2019
Institución organizadora:
Facultad de Ciencias Exactas y Naturales UNCUYO
Resumen:
Los caracteres de tipo cuantitativo, como la tolerancia a la sequía, el peso o altura deuna planta, son el resultado de la expresión conjunta de varios genes, y representanuna variación continua en la población. El estudio de estos caracteres se realizamediante la identificación de las regiones del genoma que contienen a dichos genes. Aestas regiones se les denomina locus de caracteres cuantitativos o QTL (QuantitativeTrait Locus, por sus siglas en inglés). Para detectar QTL se utilizan marcadoresmoleculares, que son secuencias de ADN de posición conocida en el genoma, quepermiten identificar (etiquetar) y monitorear a nivel individual o poblacional lasdiferencias o similitudes entre individuos relacionados genéticamente (Collard et al.,2005; Semagn et al., 2006). En particular, los SNPs: Polimorfismo de nucleótido simple(Single Nucleotide Polymorphism, por sus siglas en inglés) son marcadores basadosen la identificación de la sustitución de un nucleótido por otro, representandosolamente dos alelos simples. Un haplotipo es una combinación de alelos dediferentes loci de un cromosoma que son trasmitidos juntos, ya que están ligados.Dada la alta variabilidad alélica, la probabilidad de que dos individuos no relacionadospresenten un mismo haplotipo, es prácticamente nula. Es por esto que el estudio dehaplotipos se ha convertido en una herramienta útil en la determinación de relacionesgenéticas entre individuos. A menudo, el procedimiento para la identificación del tipode SNP que tiene cada individuo no se completa, lo que lleva a un faltante de valores.El objetivo que se tiene es identificar los individuos que tengan todos sus marcadoresespecificados, a los que llamaremos haplotipos, los cuales serán tomados dereferencia para emparentar los marcadores incompletos con un haplotipo semejante.Esta operación es lo que se conoce como clusterización. Como soporte metodológicoutilizamos el lenguaje de programación R, ya que este programa facilita lacomparación y operación sobre una mayor cantidad de datos en un tiempo menor. Enparticular para esta investigación se abordó de lleno la optimización del algoritmo declusterización del paquete R/clusterhap (Quero & Simondi, 2016). Para esto,estudiamos con detenimiento el funcionamiento de la función clusterhap del paquetehomónimo, para luego mejorar el algoritmo utilizando funciones vectorizadas, queaceleran el procedimiento interno que realiza el programa para efectuar cálculos. Así,dado un QTL pudimos asociarle un haplotipo a cada individuo (Figura 1), a través deun algoritmo de una menor cantidad de código. Además, comparamos la velocidad decómputo del algoritmo original vs. el algoritmo nuevo, y obtuvimos una respuestafavorable hacia este último. Logramos el análisis de bases de datos numerosas, que elalgoritmo original no podía resolver, y además acortamos los tiempos, ya queobtuvimos respuestas más rápidas. Por lo tanto, observamos una mejora sustancial alalgoritmo original, que se traduce en una mayor capacidad de cómputo.