BECAS
PEÑAS BALLESTEROS Andrea
congresos y reuniones científicas
Título:
Análisis comparativo de diferentes métodos y puntos de corte para la determinación de expresión génica diferencial en bases de datos complejas obtenidas de transcriptomas de maíz
Autor/es:
PEÑAS BALLESTEROS, A; BARICALLA, AA; IGLESIAS, J
Reunión:
Simposio; 8vo Simposio Argentino de Jóvenes Investigadores en Bioinformática; 2023
Institución organizadora:
RSG Argentina
Resumen:
En la actualidad, existe una amplia variedad de datos transcriptómicos públicamente disponibles enNCBI, provenientes de estudios donde se ha evaluado la respuesta del cultivo de maíz frente a lossiguientes patógenos: Fusarium verticillioides, F. graminearum y Ustilago maydis. Asimismo, existeuna amplia variedad de herramientas para determinar los genes que se expresan diferencialmenteen esta clase de estudios. Dos de las herramientas más utilizadas son DESeq2 y edgeR, ambas sebasan en un ajuste por modelos lineales generalizados con distribución binomial negativa, peropresentan diferencias al momento de normalizar y estimar la dispersión de los datos. Además,edgeR permite la utilización de dos métodos con enfoques diferentes para ajustar y contrastar losdatos: la prueba de razón de verosimilitud (LRT) y la prueba F de cuasi verosimilitud (QL-F test). Laelección de la metodología a utilizar se dificulta cuando los diseños están conformados por variosfactores, dado que el análisis de los datos y la determinación de los genes diferencialmenteexpresados son mucho más complejos. El objetivo de este trabajo fue comparar diferentesherramientas, enfoques y puntos de corte utilizados para determinar expresión génica diferencial enun metaanálisis basado en datos de transcriptomas de maíz.Se utilizaron datos transcriptómicos públicamente disponibles provenientes de cinco proyectos deNCBI donde se había evaluado la respuesta de genotipos resistentes y susceptibles frente a algunode los tres patógenos, entre 48 y 72 horas post-infección. Se evaluó la calidad de los datos deRNA-seq y, en caso de ser necesario, fueron procesados mediante Trim galore!. Los transcriptos semapearon al genoma de maíz en la última versión disponible (v5) mediante HISAT2 y lostranscriptos mapeados en regiones exónicas codificantes se cuantificaron mediante featureCounts.A partir de los conteos obtenidos, se determinaron los genes diferencialmente expresados medianteedgeR (LRT y QL) y DESeq2, utilizando valores de FDR de 10 -2 y 10 -3 como puntos de corte. Paraambas herramientas, se contrastaron genotipos resistentes contra susceptibles a partir de un diseñocon dos factores: Genotipo y Proyecto. El primer factor clasifica a las muestras según si provienen degenotipos resistentes o susceptibles y el segundo las clasifica según el proyecto de NCBI al cualestán asociadas (metaanálisis).En líneas generales, para las comparaciones realizadas, la cantidad de genes diferencialmenteexpresados fue mayor con DESeq2 al tener en cuenta el mismo punto de corte, mientras que lamenor cantidad de genes se obtuvo a partir del método QL de edgeR. Al comparar los genesdiferencialmente expresados, las herramientas coincidieron en casi todos los genes encontrados apartir de QL.EdgeR podría ser una herramienta más restrictiva a la hora de encontrar genes diferencialmenteexpresados, sobre todo al utilizar el método de cuasi verosimilitud (QL). Mientras que DESeq2,representaría una herramienta más permisiva, permitiendo encontrar una mayor cantidad de genesdiferencialmente expresados.