INVESTIGADORES
NOGUERA Martin Ezequiel
congresos y reuniones científicas
Título:
Estudio de la correlación entre las secuencias de proteínas con la temperatura óptima de crecimiento del organismo del cual provienen
Autor/es:
HERNÁNDEZ BERTHET, AYELÉN S.; APTEKMANN, ARIEL A.; SANCHEZ, IGANCIO E.; NOGUERA, MARTÍN E.; ROMAN, ERNESTO A.
Reunión:
Simposio; 6to Simposio Argentino de Jóvenes Investigadores en Bioinformática; 2021
Resumen:
Las proteínas son moléculas esenciales para la fisiología celular. En el caso de las proteínas con estructura estable, su función está ligada a la dinámica y estructura del ensamble nativo de conformaciones. Por ende, tanto la función como la estructura se encuentran codificadas en su secuencia de aminoácidos. Existe una gran diversidad de ambientes naturales en los que crecen los organismos, lo que exige que su metabolismo se encuentre adaptado para funcionar en esos entornos. De esta forma, aquellas proteínas esenciales para la vida deberán funcionar adecuadamente a temperaturas cercanas a las que crece el organismo. Usualmente ocurre que la temperatura óptima de funcionamiento de la proteína coincide con aquella que es óptima para el crecimiento del organismo (TOC) en la que se encuentra. En este trabajo estudiamos secuencias pertenecientes a diferentes familias de proteínas: Adenilato kinasa (ADK), Piruvato kinasa (PK) y Fosfoglicerato kinasa (PGK). Analizamos cómo las diferencias entre estas secuencias se correlacionan con la TOC de los organismos de los cuales provienen.Para encontrar las correlaciones disponemos de una base de datos de Arqueas de 267 organismos con su genoma secuenciado y su TOC reportada. Realizamos alineamientos múltiples de secuencias para las proteínas de las familias en estudio con los organismos que se encuentran en nuestra base de datos. Una vez alineadas, hicimos comparaciones para cada posición del alineamiento entre todos los pares de secuencias y formamos una coordenada cartesiana (x,y) donde el valor de ?x? es 1 si el aminoácido en esa posición difiere entre las dos secuencias, y 0 en caso contrario. Por otro lado, el valor de ?y? es la diferencia de TOC (∆TOC) entre los organismos correspondientes. Una vez hechas todas las comparaciones, calculamos el coeficiente de correlación de Spearman (rho) para cada posición. Aunque los valores de correlación media varían entre las familias en estudio, para los tres casos encontramos posiciones puntuales con valores de correlación estadísticamente significativos (valores 2 desvíos estándar mayor a la media). Los resultados obtenidos fueron comparados con datos bibliográficos reportados para las diferentes familias encontrando coincidencias. Por ejemplo, en el caso de ADK los residuos se encuentran asociados a la estabilidad y la flexibilidad de la proteína.Finalmente, para cada familia encontramos grupos de residuos que maximizan la correlación con la TOC. Utilizando este grupo de posiciones, separamos nuestro set de datos en dos: 50% se utilizó para obtener parámetros globales del algoritmo y 50% para evaluar el poder predictivo. Las TOC predichas tienen un R igual a 0.88 cuando comparamos con las temperaturas reportadas. En conclusión, nuestro algoritmo permitió identificar residuos asociados con la adaptación a la temperatura, lo que es una información importante para entender la base estructural de tal adaptación y para potenciales aplicaciones tecnológicas. Además, se mostró como una metodología sencilla para predecir la temperatura de crecimiento de los organismos.