PERSONAL DE APOYO
GOMEZ CARRILLO Manuel
congresos y reuniones científicas
Título:
DESARROLLO DE UNA ESTRATEGIA BIOINFORMÁTICA PARA ANALIZAR MATRICES DE DATOS DE GRAN TAMAÑO
Autor/es:
LEANDRO R. JONES;; DARÍO DILERNIA,; FRANCO MORETTI,; HORACIO SALOMÓN; MANUEL GOMEZ-CARRILLO.
Lugar:
Paraná, Pcia de Entre Rios
Reunión:
Congreso; Congreso Nacional de Sida; 2007
Resumen:
Objetivos: Desarrollo de una plataforma bioinformática que permita analizar la evolución del HIV-1 en pacientes con y sin tratamiento de la Argentina mediante la utilización de matrices de datos de gran tamaño. Material y Métodos: Se construyó un “dataset” con 2906 secuencias del gen pol  por medio de concatenado de archivos, intercambio de formatos, señalización de terminales y alineamiento. Las secuencias fueron obtenidas en el período entre los años 2001 y 2007 a partir de estudios de resistencia desarrollados en el CNRS. Los datos fueron analizados mediante el programa TNT (Goloboff et al 2003). La búsqueda de árboles óptimos para matrices de gran tamaño se realiza en varias etapas; i) inferencia de árboles de longitud mínima (óptimos), ii) estimación de un consenso e iii) identificación de taxones conflictivos (Cladistics 15:415-428; Sys Biol 56:485-495). Resultados: Hemos identificado algunos árboles óptimos. Para ello se utilizó una script que realiza una gran cantidad de búsquedas (RAS+TBR seguidos de búsquedas sectoriales, deriva y fusión de árboles). Se pudieron encontrar árboles de 98223 pasos. Con las 2906 secuencias se obtuvieron resultados consistentes con reportes anteriores en relación a la distribución de subtipos. La mayoría de las secuencias correspondieron al subtipo B y recombinantes BF (98,84%) mientras que las cepas no-B/no-BF representaron el 1,16% de todas las secuencias analizadas. Conclusiones: La plataforma desarrollada fue eficaz para el análisis de matrices de datos de gran tamaño.