CIENCIAS BIOLÓGICAS Y DE LA SALUD
Investigador del CONICET publica un libro para que especialistas de diferentes disciplinas realicen reconstrucciones filogenéticas óptimas
Pablo A. Goloboff es el autor de una obra de dos volúmenes, publicada por la editorial Taylor and Francis, que puede ser de gran utilidad para taxónomos, paleontólogos, biólogos moleculares y evolutivos y especialistas de otras disciplinas.
En “De observaciones a árboles filogenéticos óptimos” y “Refinando los análisis filogenéticos”, dos volúmenes de un libro recientemente publicado por la editorial Taylor and Francis, Pablo A. Goloboff, investigador del CONICET, logra sintetizar la experiencia de treinta años de investigaciones y cursos que viene dando sobre métodos cuantitativos de análisis filogenético (establecimiento de relaciones evolutivas que diferentes seres vivos tienen entre sí).
“El libro se concentra en el análisis de datos morfológicos, enfatiza las relaciones entre filogenia y taxonomía muy fuertemente y cubre en detalle los temas que no llego a dar en profundidad en un curso de posgrado que típicamente dura una semana. Diría que representa el curso que me gustaría dictar si no tuviera limitaciones de tiempo”, señala Goloboff quien se desempeña en la Unidad Ejecutora Lillo (UEL, CONICET–Fundación Miguel Lillo) y es licenciado en Biología (UBA, 1989) con estudios de doctorado en la Universidad de Cornell y en el Museo Americano de Historia Natural de Nueva York entre 1989 y 1994.
Con esta nueva obra, Goloboff pretende que el análisis filogenético no se vea sólo como un problema técnico, sino como uno científico que involucra también cuestiones de principio. “Es común que los investigadores que usan programas para análisis filogenético los consideren sólo como un dispositivo técnico, y que piensen que esos programas – de algún modo mágico – nos revelan la verdadera filogenia del grupo. En realidad, lo único que los programas pueden hacer es, dado un criterio explícito de cómo interpretar datos, entregarnos el resultado que mejor cumpla ese criterio”, subraya el investigador.
Uno de los problemas que enfrentan quienes se inician en el estudio de la filogenia es que hay muchísima información dispersa “y, peor aún, contradictoria, acerca de cómo enfrentar la reconstrucción filogenética. Esto es porque los supuestos de los distintos métodos no siempre son los mismos, y por lo tanto es común comparar peras con manzanas”, destaca Goloboff. Y continúa: “Otro de los vacíos que intenté llenar con el libro es proveer una revisión coherente, partiendo de consideraciones explícitas desde el inicio, y de deducir a partir de ahí todo el andamiaje de métodos y técnicas para los distintos aspectos de un análisis filogenético. Y la idea es hacer todo esto sin contradicciones internas”.
El análisis filogenético de datos morfológicos
En su libro, Goloboff advierte sobre los riesgos de considerar el uso de programas para análisis filogenético como un problema meramente técnico.
“Un investigador o investigadora responsable debería tener una buena idea acerca de las cuestiones metodológicas al momento de realizar los cálculos para encontrar árboles filogenéticos óptimos – con algoritmos adecuados a la dimensión y tipo de problema bajo análisis – y también capaz de entender la plausibilidad de los resultados”, enfatiza Goloboff quien se formó como taxónomo clásico en el Museo de Ciencias Naturales Bernardino Rivadavia, en la ciudad de Buenos Aires, y a los 18 años (en 1982) publicó solo su primer estudio científico sobre arañas antes de iniciar la carrera de biología en la UBA.
La reconstrucción filogenética se basa en la idea de que, en un proceso evolutivo de descendencia con modificación, las características heredadas por los descendientes reflejarán –parcialmente al menos– el patrón de ramificación. “Así, las características –genéticas, morfológicas y de comportamiento—son la evidencia de la que disponemos para establecer nuestras hipótesis sobre parentescos relativos”, puntualiza el investigador del CONICET. Y agrega: “El problema es cómo interpretar esa evidencia, pero una vez que decidimos los principios generales de cómo interpretarla, eso se aplicará a cualquier grupo biológico e, incluso, no estrictamente biológico: los métodos para filiación de manuscritos antiguos –copiados uno a partir del otro—o comparación de artefactos arqueológicos –transmitidos de una cultura a otra con pequeñas modificaciones—usan principios semejantes”.
Los datos morfológicos – los caracteres externos o internos, observables, en que se asemejan o difieren los animales o plantas que uno esté estudiando – son los que más han usado los taxónomos. “Los biólogos de laboratorio se centran hoy día en aspectos muy moleculares, pero a veces parecen tener poca consciencia de la vastedad de la diversidad biológica”, asegura Goloboff.
Para explicar esa afirmación, el investigador menciona a modo de ejemplo que los aspectos moleculares pueden ser muy conocidos en la mosca de la fruta Drosophila melanogaster o el ratón Mus musculus, pero cuando se considera toda la diversidad de cualquier grupo grande –por ejemplo la familia Drosopohilidae, con más de 4000 especies vivientes, o el orden Rodentia con 2300– “tenemos siempre multitud de especies, y muchas apenas conocidas, de las que se han encontrado uno o unos pocos ejemplares en la historia, registrados en Museos y colecciones biológicas. Nada habría de malo – al contrario – en agregar datos genéticos para todas las especies raras conocidas de animales y vegetales, pero sería una tarea totalmente ímproba”. Y agrega que “los taxónomos buscan conocer toda la diversidad, y esto inevitablemente cae en el estudio de características morfológicas. Por el otro lado, las secuencias de ADN nos interesan y fascinan precisamente porque son las que determinan las morfologías (comportamientos, fisiología y otras variables). Así que tiene sentido concentrarse en las peculiaridades del análisis filogenético de datos morfológicos, que al fin y al cabo es lo que nos interesa y afecta, y eso es lo que hago con esta obra”.
Los principios básicos del análisis filogenético son los mismos para cualquier tipo de dato: genético, morfológico y otros. “Ahora bien, aunque los principios son los mismos para el análisis de esos tipos de datos, las peculiaridades de cada tipo de dato hacen que algunos de los métodos y cálculos necesarios para cada uno puedan diferir”, dice Goloboff.
En el caso del ADN, afirma el investigador, como se tienen sólo cuatro posibles condiciones (las bases químicas adenina, guanina, citosina y timina) y los nucleótidos aparecen ordenados en una secuencia determinada en la cual se pueden agregar o remover porciones, “es posible tomar en cuenta esas relaciones al usar ese tipo de datos para inferir una filogenia. En el caso de la morfología el abanico de condiciones que un carácter habría podido tomar es generalmente mucho mayor; además, se intenta trabajar con caracteres que no estén correlacionados, de modo que los cambios en el primer carácter observado no necesitan guardar ninguna relación con los del segundo (es más, no hay un “primer” o “segundo” carácter: el orden es irrelevante). Esto hace que los libros de texto para análisis filogenético con datos moleculares (hay unos cuantos) traten ad nauseam ciertos métodos computacionales, por ejemplo alineamiento, imprescindible en ese contexto, pero presten mínima atención a los métodos necesarios para datos morfológicos (toma y representación de datos, pesado de caracteres, análisis de caracteres de forma y otras variables)”, explica Goloboff.
TNT, un programa para armar árboles evolutivos
Goloboff ha publicado más de cien artículos científicos y alrededor de una docena de programas informáticos, entre ellos “Tree Analysis using NewTechnology” (TNT, según sus siglas en inglés), útil para el armado de árboles filogenéticos de cualquier grupo biológico.
TNT fue lanzado en 2003, es hoy de acceso libre gracias a un subsidio de la Willi Hennig Society y en sus diferentes versiones es de los más usados a nivel mundial por la comunidad científica (taxónomos, paleontólogos y otros especialistas). Hasta la fecha esta herramienta tiene más de 8.500 citas.
“Los métodos filogenéticos sirven para estudiar la evolución de cualquier grupo de organismo, plantas, animales, hongos y virus”, afirma Goloboff. Y continúa: “Muchos paleontólogos – obligados a trabajar con datos morfológicos, donde los principios fundamentales de mi programa son especialmente aplicables – utilizan también TNT en sus análisis filogenéticos”.
Por ejemplo, TNT permitió que un equipo de paleontología de China determinase en un trabajo, publicado en 2021 en Innovation, que un cráneo hallado en ese país representaba una nueva especie de Homo filogenéticamente cercano a Homo sapiens y a Homo neanderthalensis. Y en el mismo año, un estudio publicado en Cell Host and Microbe (del grupo Cell), liderado por especialistas del Laboratorio Nacional Los Álamos (LANL, por sus siglas en inglés), en Estados Unidos, y del que también participó Goloboff, se basó en esa herramienta bioinformática para arrojar información sobre la evolución del SARS-CoV-2 y el virus de la inmunodeficiencia humana tipo 1 (VIH-1).
Si bien los principios básicos del análisis filogenético son relativamente sencillos, la aplicación de estos principios en la práctica es mucho más complicada, afirma Goloboff. Y explica: “Una de las dificultades es que, al tratarse de un problema combinatorial, el número de posibles árboles filogenéticos es astronómico. Cada árbol posible es una hipótesis que no puede descartarse a priori; lo único que discrimina entre esos árboles es cómo se ajustan a los datos. Por lo tanto, es necesario poder evaluar la mayor cantidad posible de árboles, y esto requiere de programas eficientes. La velocidad de cálculo (gracias sobre todo a mis años de trabajo en este tema) es uno de los aspectos en que TNT sobresale”.
Como TNT permite muchos tipos distintos de análisis, su uso dista de ser sencillo. “Por eso, uno mis objetivos en el libro es dar una guía general para que un investigador pueda aprovechar los recursos de análisis de TNT lo más a fondo posible, al mismo tiempo entendiendo los principios básicos detrás de cada tipo de cálculo. De esa manera, intento cubrir tanto la parte conceptual como la parte práctica, y sin que la parte práctica resulte una receta que se repite mecánicamente sin entender por qué”, señala Goloboff.
Análisis filogenético: ¿Revelar la verdad o aumentar la comprensión?
La postura del libro de Goloboff es que una hipótesis filogenética – al igual que cualquier teoría científica – debe ser aceptada o no sólo en la medida en que permita entender, de manera más acabada, una serie más grande de observaciones.
Una de las frases que resume la propuesta de su libro es que “no se elige una teoría para explicar observaciones porque se piense que es verdadera, sino que se cree que es verdadera cuando explica observaciones”. Enfatiza Goloboff que la frase no es suya, pero que subyace a la mayoría de sus contribuciones metodológicas. “Este enfoque de la reconstrucción filogenética propone preferir aquella hipótesis de filogenia que me permita entender la mayor cantidad posible de semejanzas observadas en términos de ancestralidad común. Los árboles filogenéticos nos interesan y nos sirven porque nos permiten entender (en una de las dimensiones posibles de ese entendimiento) la distribución de caracteres observada. Esto se conoce como criterio de parsimonia (no necesariamente idéntico al principio filosófico de parsimonia, que puede interpretarse diferentemente). Los supuestos previos son mínimos. Este enfoque es el que se conoce generalmente como cladística, y es el enfoque principal de mi libro”, indica Goloboff.
Existe otra postura de que para estimar filogenias se deben usar métodos probabilísticos basados en la verosimilitud (likelihood en inglés), es decir, la idea de que se debería preferir como hipótesis filogenética aquella que – dado un modelo general de cómo cambian los caracteres en el tiempo – confiera la máxima probabilidad a las observaciones (los métodos Bayesianos, tan en boga hoy día, están muy relacionados con ese criterio). “Este planteo es un poco simplista, y como tantas ideas simplistas, fácilmente genera muchos adeptos; los métodos de likelihood son hoy día ubicuos. Suena fantástico, pero en la realidad hay tantas variables – y la evolución es un proceso donde tan poco se conserva constante a lo largo del tiempo – que resulta muy difícil establecer un modelo general de cómo pueden cambiar las características a lo largo del tiempo. Es un poco más plausible en el caso de secuencias de ADN, pero la morfología es muy difícil de modelizar.”, enfatiza el científico del CONICET.
Como ejemplo, Goloboff cita que uno de los supuestos del modelo más usado en el análisis probabilístico de datos morfológicos es la homogeneidad, es decir que, a lo largo de una rama dada del árbol, aumenta o disminuye para todos los caracteres simultáneamente la probabilidad de cambio (que depende de tasa evolutiva básica y tiempo). “Con algunos supuestos adicionales, esto puede resultar en modelos evolutivos donde la coincidencia en dos especies derivadas a partir de un mismo ancestro tenga una menor probabilidad de deberse a herencia común que a adquisiciones independientes (y diría además que si este modelo se cumple, en buena medida priva a los árboles filogenéticos de su misma razón de ser). Se puede acudir a argumentos para justificar estos modelos en el caso del ADN, pero no para la morfología. Si el supuesto de homogeneidad se cumpliera en la morfología, la probabilidad de que en los vertebrados se osifique o no el cartílago de Meckel debería ser la misma de que aparezcan élitros como los de los escarabajos lo cual claramente no es el caso”, explica. Y agrega: “Podemos construir test estadísticos para ver si el grado de homogeneidad de tasas evolutivas entre subconjuntos de caracteres cumple con la homogeneidad predicha por el modelo. Yo lo he hecho, y no se cumple ni a palos”.
Goloboff advierte que hay una actitud muy frecuente entre varios científicos y científicas de que se pueden conocer verdades absolutas. “Esto viene junto con la idea de que ciertos métodos funcionan porque nos revelan la ‘verdadera’ respuesta. Debe ser un sentimiento muy reconfortante, pero esta postura es bastante peligrosa no solo para un investigador o una investigadora, sino hasta diría para la humanidad”, advierte.
“La inteligencia artificial suena fantástica para ciertas cosas, por ejemplo, conducir un Tesla, pero delegar determinado tipo de decisiones en una caja negra es una irresponsabilidad”, enfatiza el investigador. Y agrega: “Lo único que tenemos los humanos son observaciones indirectas de la realidad porque son mediadas por nuestros sentidos que interpretamos de cierto modo, y tenemos teorías que nos permiten explicarnos el porqué de ciertos fenómenos.”
Más cercano a la filogenia, el investigador del CONICET subraya que no se debería considerar que la conclusión de un trabajo vale sólo en función del programa de computadora utilizado. “Todo lo que hace el programa es darnos el árbol que maximiza el likelihood o la parsimonia, pero es responsabilidad del investigador o investigadora entender (aunque sea de manera aproximada) qué pasos siguió el programa para efectivamente tratar de maximizar esos valores, y qué es lo que la maximización de esos valores representa. No son las cuestiones más fáciles del mundo, cierto, pero tampoco las más difíciles, y son temas de investigación apasionantes. Espero que el libro transmita un poco de ese entusiasmo a los potenciales interesados e interesadas”, concluye.
Referencia bibliográfica:
Goloboff, P. A. (2022). From Observations to Optimal Phylogenetic Trees: Phylogenetic Analysis of Morphological Data: Volume 1. Routledge –Taylor and Francis Group, CRC Press. https://doi.org/10.1201/9781003220084
Goloboff, P. A. (2022). Refining Phylogenetic Analyses: Phylogenetic Analysis of Morphological Data: Volume 2. Routledge –Taylor and Francis Group, CRC Press. https://doi.org/10.1201/9780367823412
Por Bruno Geller