INVESTIGADORES
BALZARINI Monica Graciela
congresos y reuniones científicas
Título:
Ordenamiento de muestras de ADN a partir de datos genómicos de distinta naturaleza
Autor/es:
BRUNO, C.; BALZARINI, M.
Lugar:
Corrientes
Reunión:
Congreso; X Reunión Científica Grupo Argentino de Biometría; 2005
Institución organizadora:
Grupo Argentino de Biometría
Resumen:
El explosivo crecimiento de bases datos para obtener información genómica, demanda nuevas estrategias de análisis. Las distancias entre muestras obtenidas a partir de datos de secuencias de nucleótidos, aminoácidos y marcadores moleculares son frecuentes en Biología Molecular. Este trabajo aborda la comparación de ordenamientos de muestras obtenidos bajo los modelos de distancias genéticas recomendados para cada tipo de dato. El Escalamiento Multidimensional métrico (MDS) permite conocer la estructura subyacente entre muestras representando gráficamente sus interdistancias. La idea es representar m muestras p-dimensionales en algún espacio euclídeo reducido tal que la matriz de distancia en ese espacio se aproxime, lo mejor posible, a la matriz de distancia en  . El MDS opera sobre la matriz B={bij}, donde bij=(aij-ai.-a.j+a..),   y dij la distancias entre la muestra i y j. La descomposición espectral de B provee un conjunto de autovalores y autovectores para la reconstrucción, para p>>m estos conjuntos serán   y   respectivamente. La coordenada principal (CP) de la muestra i sobre el eje k del espacio euclídeo reducido es  . Los valores de las CPs varían según la escala de la métrica de distancia usada y pueden ser poco informativos al comparar ordenaciones provenientes de distintos modelos de distancias genéticas. Se comparan resultados de MDS con una versión modificada de la técnica (MDS*) que implica obtener los CP previa división de los elementos de B por la suma de sus autovalores (traza). Se ordenan muestras de ADNc viral mediante estas componentes obtenidas a partir de las siguientes matrices de distancia: distancia de Jones-Taylor-Thornton entre secuencias de proteínas, distancia Felsenstein84 entre secuencias de nucleótidos, distancia basada en los scores identidad obtenidos durante el alineamiento múltiple de secuencias de aminoácidos y nucleótidos y distancias basadas en los coeficientes de similitud de Dice y Emparejamiento Simple entre perfiles de datos binarios de marcadores RFLP. El MDS* facilitó la comparación de ordenaciones obtenidas desde diferentes tipos de datos genómicos.