INVESTIGADORES
GOLOBOFF Pablo Augusto
congresos y reuniones científicas
Título:
Sesgo en búsquedas y sus consecuencias para medidas de apoyo de grupos
Autor/es:
GOLOBOFF, PABLO A.; SIMMONS, MARK
Lugar:
Santa Fe
Reunión:
Jornada; XI Reunión Argentina de Cladística y Biogeografía; 2014
Institución organizadora:
Universidad Nacional del Litoral
Resumen:
Dos métodos muy usados para buscar árboles filogenéticos consisten en randomizar el orden de adición de los terminales en múltiples secuencias de adición seguidas de permutación de ramas, o usar árboles aleatorios como el punto de partida para permutación de ramas. estos métodos también forman la base de otras estrategias de búsqueda más elaboradas (tales como algoritmos genéticos, de perturbación, o de divide-y-triunfarás). Es ampliamente asumido que, en el caso de empates en el criterio de optimalidad usado para seleccionar árboles, la aleatoreidad inherente a tales métodos elimina cualquier preferencia consistente por algunos árboles o grupos de taxones, a menos que estén realmente apoyados por los datos. esta presentación muestra que, cuando el data set es ambiguo, tanto la adición secuencial de taxones como la permutación de ramas a partir de árboles aleatorios puede (a) encontrar algunos de los árboles óptimos mucho más frecuentemente que otros, y (b) encontrar algunos grupos con una frecuencia que difiere de su frecuencia entre todos los árboles óptimos. Esto puede suceder tanto en análisis de parsimonia como de likelihood. en el caso de la adición secuencial de taxones, puede suceder incluso cuando cada posible secuenciade adición es equiprobable, y si cada posición empatada como la mejor al agregar cada terminal es seleccionada equiprobablemente. En el caso de la permutación de ramas, puede suceder incluso cuando la permutación equiprobablemente selecciona cualquiera de los árboles de mejor ajuste en el vecindario de SPR o de TBR.  Las búsquedas pueden estar sesgadas incluso para data sets pequeños y libres de homoplasia. Esto tiene consecuencias significativas para el bootstrapping salvando un sólo árbol por pseudoréplica ?los valores de apoyo pueden reflejar el sesgo de los algoritmos de búsqueda más que los valores reales de apoyo determinados por el data set.