CONICET | Buscador de Institutos y Recursos Humanos

En la actual era postgenómica, el estudio de las interacciones existentes entre proteínas resulta una pieza clave en la compresión de los complejos mecanismos moleculares presentes en los procesos biológicos. Es sabido que la información acerca de interacciones proteína-proteína mejora el entendimiento sobre ciertas enfermedades, así como también puede ofrecer nuevas perspectivas para el desarrollo de tratamientos específicos. Sin embargo, gran parte del conocimiento sobre estas interacciones muchas veces permanece oculto en la inmensa cantidad de artículos científicos, reportes técnicos y demás trabajos científicos que día a día son publicados. Asimismo, el número creciente de revistas especializadas en Biología Computacional, más su naturaleza interdisciplinaria que hace viable la publicación de resultados en foros muy diversos (tales como medicina, biología, física o informática), tornan aún más difícil esta tarea de extracción y curación de nuevo conocimiento biológico. En esta línea de investigación proponemos diseñar, implementar y evaluar una infraestructura inteligente, combinando distintas herramientas computacionales para clasificación de documentos. A partir de un conjunto de documentos previamente clasificados, el sistema inteligente utiliza: un módulo de clustering para identificar los posibles subtópicos dentro del conjunto de documentos, un módulo evolutivo para determinar la importancia global de las palabras y un módulo de clasificación que utiliza dicha información para inferir la clase a la que pertenece un nuevo documento. Particularmente, se propone el uso del sistema para un problema importante en el área de bioinformática: detectar si un documento trata sobre interacción entre proteínas, el cual puede verse como un caso particular del problema de clasificación.

enviar mensaje