INVESTIGADORES
BARRERA Antonio Daniel
capítulos de libros
Título:
Bioinformática: Búsqueda de información en bases de datos biológicas
Autor/es:
BARRERA, ANTONIO DANIEL; VALDECANTOS, PABLO ALBERTO
Libro:
Conceptos Teóricos y Prácticos para el estudio de la célula y biomoléculas
Editorial:
Cátedra de Biología Celular
Referencias:
Lugar: San Miguel de Tucumán-Tucumán; Año: 2008; p. 203 - 221
Resumen:
El volumen de información depositado en las bases de datos biológicas en los últimos años ha crecido de manera exponencial debido al gran número de proyectos de secuenciación de genomas completos que se han concluido o que están en marcha. Al mismo tiempo, en los últimos años se han desarrollado las potentes tecnologías "omicas" (genómica, transcriptómica, proteómica, metabolómica, etc.)que son capaces de aportar gran cantidad de resultados y de tipo global sobre los genes o proteínas implicados en un determinado estado o proceso celular. Por lo tanto el manejo, tratamiento y estudio de la información biológica que cada vez es mayor, requiere de la ayuda de ordenadores y de las tecnologías informáticas y computacionales. Por ello ha nacido y se esta desarrollando el campo emergente de la Bioinformática. La ciencia de la secuenciación comenzó lentamente. En la década del 50, avances significativos en las técnicas de cromatografía y etiquetado desembocaron finalmente en la elucidación de la primera secuencia de aminoácidos completa, la de la hormona peptídica insulina (1955). Transcurrieron 5 años hasta que se completo la secuencia de la primera enzima, que fue una ribonucleasa (1960). Hacia 1965 se habían secuenciado unas 20 proteínas con más de 100 residuos y para 1980 el número se estimaba en el orden de 1.500. Hasta julio del 2007 se registran 274.295 entradas de secuencias, lo cual representa 100.686.439 aminoácidos (datos obtenidos de UniProtKB/Swiss-Prot). Inicialmente, la mayoría de las secuencias proteicas fueron obtenidas por el proceso manual de degradación de Edman (Edman, 1950). Pero el paso clave para el rápido aumento en el número de proteínas secuenciadas fue el desarrollo de secuenciadores automáticos que incrementaron la sensibilidad 4 veces con respecto al procedimiento automático implementado por Edman y Begg en 1967. Los avances en espectrometría de masas también han permitido un avance significativo en la determinación de la secuencia de proteínas. Esta metodología tiene la ventaja particular de que puede identificar modificaciones post-traduccionales en las proteínas analizadas. Así por ejemplo, la técnica desempeñó un papel clave en el descubrimiento del ácido ϫ-carboxiglutámico, y su localización en la región N-terminal de la protrombina. En los años sesenta y setenta los científicos se esforzaban en desarrollar métodos para secuenciar ácidos nucleicos, pero las primeras técnicas que surgieron eran aplicables solamente al RNA, y en especial a los tRNA, por ser cortos (74 y 95 nucleótidos de longitud) y posibles de purificar en moléculas individuales. El DNA es más complejo. Las moléculas de DNA cromosómico humano pueden contener entre 55 x 10 y 250 x 106 pares de bases. Por lo que el manejo, ensamblaje y purificación de fragmentos cromosómicos de DNA es complejo y el fragmento que puede secuenciarse en un experimento es solamente de unos 500 pb. La llegada de las técnicas de clonación génica,proporcionó solución a muchos de estos inconvenientes, ya que con estas técnicas se pudieron purificar fragmentos definidos de DNA cromosómico. Hacia 1977 aparecieron dos métodos de secuenciación, que empleaban enfoques de terminación de la síntesis de la cadena (Método de Sanger)y de degradación química. Con solo cambios menores estas técnicas se extendieron a laboratorios de todo el mundo y sentaron las bases para la revolución en secuenciación de los años ochenta y noventa y el subsiguiente nacimiento de la bioinformática. Hasta agosto del 2005 el INSDC (International Nucleotide Sequence Database Collaboration) dio a conocer que las bases de datos de DNA y RNA superaron los 100 billones de bases almacenadas (esto esta representado por secuencias de genes individuales, secuencias parciales y secuencia de genomas completos). Durante la última década, la biología molecular ha sido testigo de una revolución en la obtención de información y adquisición de datos biológicos como resultado del desarrollo de técnicas rápidas de secuenciación de DNA como el correspondiente progreso en tecnologías basada en computadoras, que están permitiendo tratar con el diluvio de información, de formas cada vez más eficaces. El término en sentido amplio que se designó a mitad de los años ochenta para englobar las aplicaciones de ordenadores en las ciencias biológicas es bioinformática. Bioinformática es el campo de la ciencia en la cual la biología, la informática y la tecnología de la información se fusionan en una sola disciplina. El término se aplicó originalmente a la manipulación computacional y al análisis de datos de secuencias biológicas (DNA o proteína). Sin embargo en la actualidad y a la vista de la rápida y creciente acumulación de estructuras de proteínas disponibles el término tiende a emplearse abarcando también la manipulación y análisis de datos de estructuras tridimensionales (3D).