INVESTIGADORES
PREVOSTI Francisco Juan
artículos
Título:
ENTRADAS FALTANTES, PESOS IMPLICADOS Y RECONSTRUCCIONES FILOGENÉTICOS
Autor/es:
PREVOSTI, F. J. Y CHEMISQUY, M. A.
Revista:
DARWINIANA
Editorial:
INSTITUTO DE BOTÃNICA DARWINION
Referencias:
Lugar: San Isidro; Año: 2007 p. 31 - 33
ISSN:
0011-6793
Resumen:
<!--
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{mso-style-parent:"";
margin:0cm;
margin-bottom:.0001pt;
mso-pagination:widow-orphan;
font-size:12.0pt;
font-family:"Times New Roman";
mso-fareast-font-family:"Times New Roman";}
@page Section1
{size:612.0pt 792.0pt;
margin:70.85pt 3.0cm 70.85pt 3.0cm;
mso-header-margin:36.0pt;
mso-footer-margin:36.0pt;
mso-paper-source:0;}
div.Section1
{page:Section1;}
-->
El efecto de las entradas
faltantes (EF) en la reconstrucción filogenética ha sido estudiado por varios
autores (e.g. Kearney & Clark, 2003). Estos abarcan el análisis de las ventajas
y desventajas de las estrategias utilizadas en trabajos empíricos para lidiar
con las EF y el impacto de estas en la resolución, exactitud y soporte de los
árboles obtenidos (e.g. Wilkinson, 2003). En otros trabajos se utilizaron
simulaciones para explorar el efecto del porcentaje y patrón de distribución de las entradas
faltantes y a la variación de otros parámetros como estructura de los árboles,
largo de rama, tipos de caracteres y número de taxones y caracteres (Wiens 2003, a y b). La mayoría de
estos estudios se realizaron usando máxima parsimonia como criterio de
optimalidad y en todos los casos se utilizaron pesos iguales. Dado que las
búsquedas basadas en estrategias de pesado diferencial de caracteres (e.g.
pesos sucesivos e implicados) utilizan alguna medida de homoplasia y/o ajuste
de los caracteres, las EF podrían generar un sesgo adicional (Makovicky, 2000).
Este argumento suele utilizarse para no emplear estas estrategias de búsqueda
en el ambiente paleontológico, aunque no sea explicitado en los trabajos
publicados. El principal objetivo de este trabajo es analizar el efecto de las EF en
búsquedas realizadas tanto con pesos iguales como implicados, partiendo de
matrices morfológicas disponibles en la bibliografía.
Se
realizaron cuatro tipos de análisis por separado: 1) manteniendo intactas las
matrices, se agregaron nuevas EF al azar; 2) se reemplazaron las EF ya
presentes en las matrices por un estado al azar de cada carácter y luego se introdujeron
distintos porcentajes EF al azar; 3) Similar a la anterior, pero las EF fueron
restringidas a 15% y 50% de los taxones; 4) las EF introducidas se ubicaron en 15%
y 50% de los caracteres. En todos los casos, la probabilidad de ser agregada
una EF a una celda varió entre 0,15 y 0,9. Para comparar el desempeño de las
distintas estrategias de búsqueda (pesos iguales y pesos implicados con k 3,
15, 50 y 100) se utilizaron medidas de similitud topológica. Se consideró que
la topología correcta es el consenso estricto de los árboles más
parsimoniosos obtenidos del análisis de las matrices sin modificar. Se calculó
el número de nodos correctos (NC) y erróneos (NE) recuperados a partir de las
matrices modificadas así como el porcentaje de NC (PC) y el porcentaje de NE
(PE) (Ramírez, 2003). Para comparar estos valores entre las diferentes
estrategias de búsqueda se utilizaron el test de Kruskal Wallis y el test de U
de Mann-Whitney.
Se
recopilaron 311 matrices, que abarcan el rango de 4-443 caracteres y 5-207
taxones, estando más del 50% de las matrices por debajo del límite de 40
taxones y 100 caracteres. Los porcentajes de EF originales de estas matrices
van desde 0 a
49,47%, con una media de 12,86%. En el análisis 2 se incluyeron todas estas
matrices, mientras que para el 1, 3 y 4 se utilizó un subgrupo de las mismas
compuesto por 135 matrices. Las matrices descartadas fueron seleccionadas al
azar entre las matrices más chicas (menos de 40 taxones y 100 caracteres).
Los cuatro
tipos de análisis realizados dieron resultados similares. Como era esperable,
al aumentar el EF, disminuye el NC y el PC y aumentan el E y el PE. Las únicas
diferencias significativas encontradas fueron en NC y en NE, siendo mayor el primero
y menor el segundo en pesos implicados con respecto a pesos iguales. Estas
diferencias se pierden en los análisis con altos valores de EF. También se
observa que PC, NC y NE muestran una correlación significativa y positiva con
el número de caracteres, mientras que el número de taxones se correlaciona
positivamente con NC, PE y NE y negativamente con PC. En ciertos análisis, la
correlación entre PC y número de taxones tiende a ser positiva al aumentar el
EF.
De esos
resultados se puede extraer que: al aumentar la cantidad de EF disminuye la
señal filogenética y aumenta el error; existe una correlación positiva entre el
número de caracteres y los nodos recuperados (tanto PC como NC) y al variar la
distribución de las EF en la matriz los resultados se ven muy poco afectados.
Estos resultados son coherentes con los publicados previamente por otros
autores (salvo el último que coincide parcialmente) (Wiens 2003 a y b). La comparación
entre pesos iguales y pesos implicados muestra que el último recupera más nodos
(tiene un NC mayor), pero también posee un error más elevado (NE mayor). Sin
embargo, las diferencias medias son poco marcadas y los rangos se superponen
ampliamente (FIG??). Por otro lado, el NE y el NC pueden estar influidos por la
resolución de los árboles correctos lo cual podría explicar estas diferencias (Ramírez,
2003). La ausencia de diferencias significativas en el PC y el PE es coherente
con esto último. Según estos resultados, la presencia de un elevado número de
entradas faltantes no es un argumento válido para no utilizar pesos implicados
como estrategia de búsqueda.