INVESTIGADORES
RODRIGUEZ Gustavo Ruben
congresos y reuniones científicas
Título:
Herramientas bioinformáticas para el análisis de secuencias en la búsqueda de genes candidatos
Autor/es:
POZZI, FLORENCIA; GREEN, GISELA YAEL; RODRÍGUEZ, GUSTAVO RUBÉN; FELITTI, SILVINA
Lugar:
Rosario, Santa Fe
Reunión:
Congreso; XVIII Congreso y XXXVI Reunión Anual de la Sociedad de Biología de Rosario; 2016
Institución organizadora:
Sociedad de Biología de Rosario
Resumen:
Elanálisis de grandes bases de datos moleculares para la búsqueda eidentificación de genes candidatos constituye uno de los problemas actuales delárea de la biología molecular vegetal. Una posible solución es el uso dellenguaje de programación R, un programa de código abierto y uso gratuito quepermite el análisis de datos de forma automatizada. Sin embargo, la elaboración de un algoritmo en lenguaje Rrequiere de una exhaustiva búsqueda bibliográfica y conocimiento de lasfunciones involucradas.El objetivo de este trabajo es la elaboración de dos herramientas bioinformáticasdestinadas al análisis de secuencias para la búsqueda e identificación de genescandidatos. A continuación se describen los problemas a ser automatizados: 1) Eliminarde n fragmentos secuenciados las bases nucleotídicas correspondientes a loscebadores utilizados para la amplificación por PCR. Posteriormente, alinearcada uno de los fragmentos contra una base de datos en búsqueda del mayorporcentaje de homología respecto de otras especies y la identidad de lasecuencia; 2) Obtener un segmento determinado de una secuencia de ADN de mayorlongitud. Además, realizar un análisis de expresión diferencial de genes codificadosen dicho segmento. En ambos casos se trabajaron archivos FASTA, que correspondea un formato basado en texto utilizado para representar secuencias de ácidos nucleicos o péptidos. La simplicidadde este formato hace fácil el manipular y analizar secuencias haciendo uso deherramientas de procesamiento de textos y lenguajes de programación. Lastareas requeridas para solucionar ambos problemas se automatizaron mediante la construcciónde algoritmos en lenguaje de programación R. Comoresultado, la primera herramienta permite la eliminación de las bases correspondientesa los cebadores. Este proceso es posible vinculando un archivo FASTAconteniendo n fragmentos secuenciados con otro conteniendo las secuencias delos cebadores a ser identificados y eliminados. El mismo comando permitegenerar un nuevo documento con secuencias ?limpias? y contrastarlo a bases dedatos disponibles en la web para realizar el alineamiento correspondientedentro del entorno de R. La segunda herramienta desarrollada permite, a travésde ciertos parámetros establecidos, la localización y extracción de un segmentoa partir de una secuencia de mayor longitud. La sub-secuencia generada seutiliza para conocer los genes codificados en dicho segmento mediantealineamiento fuera del entorno de R. A partir de la vinculación de archivos, estecomando permite filtrar de un documento conteniendo las lecturas de miles degenes (transcriptoma), solo aquellos de interés. A su vez, realiza un análisisde expresión diferencial sobre los genes seleccionados y recopila, de formaautomática, los resultados en un nuevo archivo que almacena en una carpetadefinida. Como conclusión, la automatización del análisis de secuencias permiteel ahorro de tiempo y esfuerzo y la generación de datos con un porcentaje menorde errores técnicos en solo un click. A la vez, su generalización y simplicidadhacen que estas herramientas sean aplicables a las tareas llevadas a cabo porotros grupos de investigación.