BECAS
PARLANTI tatiana SofÍa
congresos y reuniones científicas
Título:
R en Genética: Clusterización de Haplotipos
Autor/es:
PARLANTI, TATIANA SOFÍA; QUERO, GASTÓN; SIMONDI, SEBASTIÁN RICARDO
Reunión:
Otro; Festival Latinoamericano de Instalación de Software Libre FLISol 2019; 2019
Institución organizadora:
UTN Mendoza, R-Ladies
Resumen:
Los caracteres de tipo cuantitativo, son el resultado de la expresión conjunta de varios genes, y representan una variación continua en la población. El estudio de estos caracteres se realiza mediante la identificación de las regiones del genoma que contienen a dichos genes. A estas regiones se les denomina locus de caracteres cuantitativos o QTL (Quantitative Trait Locus). Para detectar QTL se utilizan marcadores moleculares como los SNPs: Polimorfismo de nucleótido simple (Single Nucleotide Polymorphism), los cuales están basados en la identificación de la sustitución de un nucleótido por otro, representando solamente dos alelos simples. Un haplotipo es una combinación de alelos de diferentes loci de un cromosoma que son trasmitidos juntos, ya que están ligados. Dada la alta variabilidad alélica, la probabilidad de que dos individuos no relacionados presenten un mismo haplotipo, es prácticamente nula. Es por esto que el estudio de haplotipos se ha convertido en una herramienta útil en la determinación de relaciones genéticas entre individuos. A menudo, el procedimiento para la identificación del tipo de SNP que tiene cada individuo no se completa, lo que lleva a un faltante de valores. El objetivo que se tiene es identificar los individuos que tengan todos sus marcadores especificados, a los que llamaremos haplotipos, los cuales serán tomados de referencia para emparentar los marcadores incompletos con un haplotipo semejante. Esta operación es lo que se conoce como clusterización. Como soporte metodológico utilizamos el lenguaje de programación R. En particular para esta investigación se abordó de lleno la optimización del algoritmo de clusterización del paquete R/clusterhap. Así, dado un QTL pudimos asociarle un haplotipo a cada individuo, a través de un algoritmo de una menor cantidad de código. Además, comparamos la velocidad de cómputo del algoritmo original vs. el algoritmo nuevo, y obtuvimos una respuesta favorable hacia este último. Logramos el análisis de bases de datos numerosas, que el algoritmo original no podía resolver, y además acortamos los tiempos, ya que obtuvimos respuestas más rápidas. Por lo tanto, observamos una mejora sustancial al algoritmo original, que se traduce en una mayor capacidad de cómputo.