IFEVA   02662
INSTITUTO DE INVESTIGACIONES FISIOLOGICAS Y ECOLOGICAS VINCULADAS A LA AGRICULTURA
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Análisis de datos de expresión con R como herramienta para el estudio de familias génicas
Autor/es:
SAURA SANCHÉZ MT; CHIRIOTTO TS
Lugar:
CABA
Reunión:
Congreso; Conferencia Latinoamericana sobre el uso de R en investigación y desarrollo; 2018
Institución organizadora:
Sociedad Argentina de Informática
Resumen:
Las proteínas B-box de Arabidopsis thaliana constituyen una familia de 32 miembros (BBX1 a BBX32) que están implicadas en múltiples procesos a lo largo de toda la vida de la planta. Participan en procesos de desetiolación, floración y germinación entre otros. También, actúan en respuestas ambientales como en las respuestas a la percepción de plantas vecinas o a la salinidad. Los datos proporcionados por RNAseq y microarreglos hechos en plantas bajo condiciones experimentales diversas pueden suministrar información importante y robusta acerca de la expresión de los genes de interés y pueden servir para plantear nuevas hipótesis de trabajo. En la actualidad, la base de datos existente es extensa y variada. Los datos publicados pueden estar crudos, procesados y también de ambas formas. Como consecuencia, realizar análisis con herramientas convencionales como tablas Excel es complejo y lento, pudiendo cometer múltiples errores en los numerosos pasos del proceso. El objetivo del siguiente trabajo es analizar la familia de proteínas B-box mediante el software R en microarreglos y RNAseq de plantas en distintas condiciones experimentales.Se seleccionaron y trabajaron con más de diez bases de datos de microarreglos y RNAseq publicados en Geo DataSet (https://www.ncbi.nlm.nih.gov/gds) y ArrayExpress (https://www.ebi.ac.uk/arrayexpress/). El análisis de estos datos se llevó a cabo con distintos paquetes de Bioconductor en R. Se utilizó el paquete ggplot2 para representar gráficamente los genes B-box según los cambios de expresión a lo largo de las distintas condiciones experimentales estudiadas. Este análisis permitió agrupar los genes B-box en sendos clusters según su patrón de expresión. Asimismo, se analizó la co-expresión con otros genes.El uso de software R permitió de manera simple y relativamente rápida obtener datos homogenizados de distintas bases de datos de microarreglos y RNAseq. Se puedo crear diversos parámetros de búsqueda lo que posibilitó obtener información sin necesidad de nuevos análisis. Además, se pudo programar el formato de los gráficos y diseñarlos acorde a las necesidades requeridas. Gracias a este tipo de análisis podemos estudiar grandes familias génicas con el fin de encontrar miembros que puedan compartir funciones biológicas o inferir nuevos procesos en los que participan estos genes.