INVESTIGADORES
POL Diego
congresos y reuniones científicas
Título:
Sobre las estragegias “divide-and-conquer”: rec-i-dcm3 vs. TNT
Autor/es:
GOLOBOFF, P.A.; POL, D.
Lugar:
Trelew, Chubut, Argentina
Reunión:
Jornada; VI Reunión Argentina de Cladística y Biogeografía; 2006
Institución organizadora:
Museo Paleontológico Egidio Ferulgio
Resumen:
Recientemente Roshan et al. (2004) han descrito un nuevo método descripto como una estrategia de "divide-and-conquer" para el análisis de grandes datasets (i.e., entre 2500 y 14000 taxones). Estos autores describen esta técnica, rec-i-dcm3, y sostienen que muestra un comportamiento mucho más eficiente que el análisis utilizando TNT. Rec-i-dcm3 es una técnica basada en la creación de datasets reducidos, seguida de una búsqueda de parsimonia para cada datasets reducido y una fusión de los subárboles resultantes. El programa desarrollado por estos autores efectúa la división de la matriz en datasets reducidos, emplea TNT para analizar los distintos subproblemas, y combina los resultados producidos por TNT.A pesar de que los autores no explicitan en su trabajo, este software también realiza una búsqueda de TBR en el dataset completo tomando como punto de partida el árbol resultante de la unión de los árboles de los distintos subproblemas (utilizando el swappeador de TNT). Este paso es necesario dado que árboles óptimos de los subproblemas rara vez producen resultados óptimos para el análisis de la matriz completa.TNT posee una técnica propia de “divide-and-conquer”, llamada búsquedas sectoriales, que elige subproblemas tomando grupos no disjuntos de HTUs en lugar de conjuntos disjuntos de OTUs como lo hace rec-i-dcm3. En esta charla se describen las ventajas de las búsquedas sectoriales sobre rec-i-dcm3 y se revisan los resultados obtenidos por Roshan et al. (2004) en donde sostienen la superioridad de rec-i-dcm3 para el análisis de grandes datasets. Estos dos métodos se contrastan reanalizando los dos datasets más grandes analizados por Roshan et al. (2004), que constan de aproximadamente 11000 y 14000 taxones.La supuesta superioridad de este último método se basa principalemente en que: 1) los parámetros algorítmicos de las corridas realizadas con TNT estaban determinados de modo deficiente y 2) TNT debería haber analizado sectores más grandes que los valores default, con búsquedas más exhaustivas que las realizadas por Roshan et al. (2004). Al corregir estos parámetros, las búsquedas combinadas realizadas en TNT son claramente superiores a las realizadas por rec-i-dcm3.