CONICET | Buscador de Institutos y Recursos Humanos

El efecto de las entradas faltantes (EF) en la reconstrucción filogenética ha sido estudiado por varios autores (e.g. Kearney & Clark, 2003). Estos abarcan el análisis de las ventajas y desventajas de las estrategias utilizadas en trabajos empíricos para lidiar con las EF y el impacto de estas en la resolución, exactitud y soporte de los árboles obtenidos (e.g. Wilkinson, 2003). En otros trabajos se utilizaron simulaciones para explorar el efecto del porcentaje y patrón de distribución de las entradas faltantes y a la variación de otros parámetros como estructura de los árboles, largo de rama, tipos de caracteres y número de taxones y caracteres (Wiens 2003, a y b). La mayoría de estos estudios se realizaron usando máxima parsimonia como criterio de optimalidad y en todos los casos se utilizaron pesos iguales. Dado que las búsquedas basadas en estrategias de pesado diferencial de caracteres (e.g. pesos sucesivos e implicados) utilizan alguna medida de homoplasia y/o ajuste de los caracteres, las EF podrían generar un sesgo adicional (Makovicky, 2000). Este argumento suele utilizarse para no emplear estas estrategias de búsqueda en el ambiente paleontológico, aunque no sea explicitado en los trabajos publicados. El principal objetivo de este trabajo es analizar el efecto de las EF en búsquedas realizadas tanto con pesos iguales como implicados, partiendo de matrices morfológicas disponibles en la bibliografía. Se realizaron cuatro tipos de análisis por separado: 1) manteniendo intactas las matrices, se agregaron nuevas EF al azar; 2) se reemplazaron las EF ya presentes en las matrices por un estado al azar de cada carácter y luego se introdujeron distintos porcentajes EF al azar; 3) Similar a la anterior, pero las EF fueron restringidas a 15% y 50% de los taxones; 4) las EF introducidas se ubicaron en 15% y 50% de los caracteres. En todos los casos, la probabilidad de ser agregada una EF a una celda varió entre 0,15 y 0,9. Para comparar el desempeño de las distintas estrategias de búsqueda (pesos iguales y pesos implicados con k 3, 15, 50 y 100) se utilizaron medidas de similitud topológica. Se consideró que la topología correcta es el consenso estricto de los árboles más parsimoniosos obtenidos del análisis de las matrices sin modificar. Se calculó el número de nodos correctos (NC) y erróneos (NE) recuperados a partir de las matrices modificadas así como el porcentaje de NC (PC) y el porcentaje de NE (PE) (Ramírez, 2003). Para comparar estos valores entre las diferentes estrategias de búsqueda se utilizaron el test de Kruskal Wallis y el test de U de Mann-Whitney. Se recopilaron 311 matrices, que abarcan el rango de 4-443 caracteres y 5-207 taxones, estando más del 50% de las matrices por debajo del límite de 40 taxones y 100 caracteres. Los porcentajes de EF originales de estas matrices van desde 0 a 49,47%, con una media de 12,86%. En el análisis 2 se incluyeron todas estas matrices, mientras que para el 1, 3 y 4 se utilizó un subgrupo de las mismas compuesto por 135 matrices. Las matrices descartadas fueron seleccionadas al azar entre las matrices más chicas (menos de 40 taxones y 100 caracteres). Los cuatro tipos de análisis realizados dieron resultados similares. Como era esperable, al aumentar el EF, disminuye el NC y el PC y aumentan el E y el PE. Las únicas diferencias significativas encontradas fueron en NC y en NE, siendo mayor el primero y menor el segundo en pesos implicados con respecto a pesos iguales. Estas diferencias se pierden en los análisis con altos valores de EF. También se observa que PC, NC y NE muestran una correlación significativa y positiva con el número de caracteres, mientras que el número de taxones se correlaciona positivamente con NC, PE y NE y negativamente con PC. En ciertos análisis, la correlación entre PC y número de taxones tiende a ser positiva al aumentar el EF. De esos resultados se puede extraer que: al aumentar la cantidad de EF disminuye la señal filogenética y aumenta el error; existe una correlación positiva entre el número de caracteres y los nodos recuperados (tanto PC como NC) y al variar la distribución de las EF en la matriz los resultados se ven muy poco afectados. Estos resultados son coherentes con los publicados previamente por otros autores (salvo el último que coincide parcialmente) (Wiens 2003 a y b). La comparación entre pesos iguales y pesos implicados muestra que el último recupera más nodos (tiene un NC mayor), pero también posee un error más elevado (NE mayor). Sin embargo, las diferencias medias son poco marcadas y los rangos se superponen ampliamente (FIG??). Por otro lado, el NE y el NC pueden estar influidos por la resolución de los árboles correctos lo cual podría explicar estas diferencias (Ramírez, 2003). La ausencia de diferencias significativas en el PC y el PE es coherente con esto último. Según estos resultados, la presencia de un elevado número de entradas faltantes no es un argumento válido para no utilizar pesos implicados como estrategia de búsqueda.

enviar mensaje