DIVULGACIÓN CIENTÍFICA

Google premió con la Beca LARA a cuatro equipos de investigación del CONICET

En su octava edición, reconoció trabajos relacionados al COVID-19 y otros aplicados a Inteligencia Artificial, salud y Aprendizaje Automático.


En la octava edición de los Premios de Investigación de América Latina (LARA), que otorga Google, se eligieron veintidós equipos de la región para apoyar sus investigaciones dentro de las áreas de COVID-19, aplicaciones de Inteligencia Artificial para el sector salud y Aprendizaje Automático. Las propuestas elegidas por Google son oriundas de Brasil, Chile, Perú, Colombia, México, y dentro de los seleccionados, hay cuatro proyectos de Argentina conformados por investigadores del CONICET.

“Los ganadores de esta octava edición no solo demuestran la increíble capacidad y potencial que tienen la academia y la investigación en América Latina sino también son un ejemplo de resiliencia en un año como el 2020, que ha significado grandes retos para toda la humanidad”, destacaron desde la organización de Google durante la premiación. Los cuatro proyectos seleccionados por Argentina, encabezados por científicos del CONICET, son muy diversos. En primer lugar, se eligió una investigación que propone rastrear la severidad del SARS-CoV-2 en barrios vulnerables de CABA, liderada por la viróloga Mariana Viegas. También, un proyecto encabezado por el científico y experto en computación Axel Soto para agilizar el diseño de fármacos. Asimismo, dentro del campo de la computación, se eligió la iniciativa impulsada por la científica Ana Gabriela Maguitman, que busca diseñar algoritmos que permitan soluciones a problemas complejos. Y también se premió al proyecto liderado por el investigador Francisco Soulignac, que propone una solución computacional para optimizar la logística de envío de productos.

 

Rastrear la severidad del coronavirus en barrios vulnerables de CABA

El primero de los proyectos ganadores de la beca LARA es el de la investigadora del CONICET Mariana Viegas, directora del grupo de Genómica de Virus Respiratorios dentro del Laboratorio de Virología del Hospital de Niños “Ricardo Gutierrez”, quien junto a la becaria del CONICET Mercedes Soledad Nabaes Jodar busca comprender la divergencia de las cepas de coronavirus distribuidas demográficamente, para poder rastrear la evolución del virus. “Genómica y metagenómica del virus SARS-CoV-2 en Argentina. Análisis integral de aspectos genéticos y evolutivos de cepas autóctonas” se titula la iniciativa que fue galardonada.

“Nuestro grupo trabaja hace muchos años en virus respiratorios, y en el contexto del SARS-CoV-2 habíamos ideado una metodología para secuencias genomas del coronavirus. Hace muchos años trabajamos con herramientas bioinformáticas que permiten analizar datos de secuenciación masiva, donde obtuvimos por ejemplo la información genómica del SARS-CoV-2, pero también la evolución de los virus, su dispersión, etcétera. Nos pareció interesante este año presentarnos al premio por eso mismo”, comenta Viegas.

El Laboratorio de Virología en el que se asienta esta investigación premiada es el nodo central del Consorcio Argentino de Genómica de SARS-CoV-2, que coordina un gran consorcio de investigadores argentinos que tienen como objetivo realizar un análisis genómico epidemiológico del coronavirus en Argentina. El laboratorio en el que trabaja Viegas realiza, puntualmente, ese análisis de la Ciudad Autónoma de Buenos Aires (CABA). El proyecto de este premio, entonces, es un paso más en ese sentido: se propone analizar las muestras que les llegan de ciertos barrios vulnerables dentro de CABA, que se vieron principalmente afectados en el inicio de la pandemia, para intentar entender cómo se dispersó el virus en dichos barrios, su evolución en comunidades que no tenían distanciamiento social y demás problemáticas.

“Quisimos analizar la comunidad bacteriana que convive con la infección respiratoria, que son los microbiomas de los aparatos respiratorios de las personas infectadas con SARS-CoV-2. La idea es analizar los genomas de coronavirus en pacientes de barrios vulnerables, sus microbiomas respiratorios y ver si la severidad de la infección presentada por los pacientes se relaciona de alguna manera”, explica Viegas. “También caracterizar la flora bacteriana que acompaña al virus en el tracto respiratorio, porque está visto que ciertas comunidades bacterianas pueden predisponer a una infección más severa del virus. Las condiciones habitacionales, tales como el hacinamiento, la mala aireación de los ambientes, las calefacciones inadecuadas, los ambientes contaminados pueden ser motivo de incidencia en la flora bacteriana de las personas en barrios vulnerables. Eso queremos estudiar, a través de los datos masivos que obtenemos de las secuenciaciones”.

 

Quimioinformática al servicio del diseño de nuevos fármacos

Otro de los proyectos seleccionados para la beca LARA fue el del investigador del CONICET Axel Soto, del Instituto de Ciencias e Ingeniería de la Computación (ICIC, CONICET-UNS) del CCT Bahía Blanca, quien junto con María Virginia Sabando, becaria del CONICET, llevan adelante un proyecto titulado “Aprendizaje de las incorporaciones moleculares para la reutilización de fármacos”. Tal como indica, su tema de investigación se inspiró en avances recientes en el área de redes neuronales, y en particular en el procesamiento del lenguaje natural.

“La idea principal es que a partir de un gran volumen de datos es posible encontrar nuevas representaciones de datos que facilitan tareas posteriores de búsqueda e inferencia estadística. Hoy en día, esto posibilita modelos computacionales con habilidades sorprendentes para entender texto. Por lo tanto, nuestra propuesta se basó en trasladar esa modalidad de aprendizaje automático al dominio químico”, explica Soto.

Teniendo en cuenta que el proceso tradicional de descubrimiento de nuevos fármacos es lento y costoso, el equipo liderado por Soto entiende que “desde la quimioinformática se contempla la aplicación de técnicas de inteligencia artificial y aprendizaje automático para la búsqueda y predicción de compuestos candidatos a drogas. Si bien el objetivo no es reemplazar enteramente el proceso tradicional de búsqueda de nuevos fármacos (utilizando pruebas in vitro e in vivo) –explica Soto- estos modelos predictivos computacionales permiten concentrar los esfuerzos en aquellos compuestos sobre los que se predice un buen comportamiento (en lo que se denomina pruebas in silico). Por lo tanto, las pruebas in silico acortan los tiempos de laboratorio y la síntesis química de compuestos. Una cuestión clave resulta, entonces, la representación de ese compuesto químico como un modelo de datos que permita capturar características distintivas del compuesto y al mismo tiempo posibilite la aplicación de técnicas de aprendizaje automático para tareas de inferencia y reconocimiento de patrones”.

En este sentido, los investigadores de este proyecto apuntarán, en primera instancia, a “entrenar” redes neuronales para aprender buenas representaciones moleculares apoyándose “en una base de datos de más de 230 millones de compuestos. Y en segunda instancia –explica el científico- ´entrenaremos´ otro tipo de red neuronal que nos permitiría obtener un modelo predictivo que vincule características moleculares con actividad farmacológica sobre distintos tipos de coronavirus. Esto facilitaría la búsqueda de drogas ya aprobadas (para algún otro uso) para el potencial tratamiento como antivirales de coronavirus (lo que se denomina reposicionamiento de drogas), como así también ayudaría en el diseño de nuevas drogas”. Los investigadores a cargo del proyecto subrayan que este proceso es igualmente aplicable para predicción de otro tipo de actividades biológicas o propiedades fisicoquímicas.

 

Soluciones simples a problemas complejos

El equipo de Ana Gabriela Maguitman, también investigadora del CONICET en ICIC, junto con Mariano Maisonnav, becario del CONICET, fue distinguido por su proyecto “Aprendiendo modelos causales de los medios digitales”. Desde hace tiempo, el grupo de investigación que componen -Grupo de Gestión de Conocimiento y Recuperación de Información de ICIC – trabaja en el área de extracción de información y en el desarrollo de modelos predictivos aplicados a problemas complejos. ¿Qué son los problemas complejos? Son problemas en los que existen muchas variables sobre las que no se tiene control, como así también relaciones entre dichas variables sobre las que existen incertidumbres. “El aprendizaje automático o semi-automático de modelos causales para abordar problemas complejos es común en escenarios como neurociencia, genómica y economía, entre otros dominios. Este aprendizaje se logra gracias a que se observan ciertos patrones o regularidades recurrentes”, explica Maguitman, especializada en aprendizaje automático y minería de texto.

“Los modelos predictivos tradicionales suelen ser deficientes a la hora de mostrar las relaciones causales que existen entre sus variables. Recientemente, gracias a grandes avances dentro de ciertas áreas de la inteligencia artificial, tales como el procesamiento de lenguaje natural y el aprendizaje automático, surgieron muchas técnicas que podemos tomar como punto de partida para construir modelos que no solo sirvan para predecir sino también para explicar de manera efectiva diferentes fenómenos complejos”, amplía la investigadora, que por su proyecto, junto con Maissonave, ya habían ganado el premio de Google en 2019. Este año, debido a la pandemia, tuvieron que continuar con su proyecto de manera virtual, pero eso no les impidió obtener nuevos avances que derivaron en que volvieran a ser premiados por Google.

El objetivo de su proyecto es desarrollar métodos automáticos capaces de aprender relaciones causales, a partir de variables y eventos extraídos de diferentes fuentes. “Parte del trabajo ya fue desarrollado y consistió en detectar menciones de eventos en los medios digitales utilizando una red neuronal artificial. El proceso que actualmente estamos llevando adelante consiste en utilizar dichos eventos y otras variables para construir modelos causales que ayuden a la toma de decisiones por parte de los expertos”, indica Maguimtan. En particular, actualmente están investigando su aplicación dentro del dominio de la economía.

“Para dar un ejemplo de aplicación: si buscamos la aparición del evento ´crisis´ en las noticias, podemos encontrar muchas menciones al mismo. Entonces, a partir de ese conjunto de menciones a ´crisis´, es posible encontrar otros eventos relacionados, que tienden a causar el evento ´crisis´ o son consecuencia del evento ´crisis´. De esa manera, es posible estudiar el evento ´crisis´ en distintos periodos de tiempo a lo largo de muchos años, buscar causas comunes y efectos comunes en distintos contextos bajo análisis, detectar patrones, ofrecer explicaciones e intentar realizar predicciones. Este tipo de análisis, al que nuestras herramientas dan soporte, permite a los expertos lograr un mayor entendimiento de un problema bajo análisis y los ayuda en la toma de decisiones”, indica la investigadora.

 

Formas de optimizar la logística de envío de productos

Por último, el investigador del CONICET Francisco Soulignac, del Instituto de Investigación en Ciencias de la Computación (ICC, CONICET-UBA), junto con el investigador Juan Jose Miranda Bront, también de CONICET, y Gonzalo Lera-Romero, ganaron la beca por su proyecto “Problemas de enrutamiento bajo congestión: algoritmos, implementaciones eficientes y datos reales”, que se enmarca en el área de la Logística Computacional.

“Nuestro interés radica en investigar aspectos algorítmicos y computacionales en el desarrollo de herramientas que asistan a la toma de decisión aplicada a problemas de logística y distribución. Más concretamente, nos centramos en problemas de distribución de última milla, comúnmente llamados problemas de ruteo de vehículos. Estos problemas modelan las decisiones en la gestión logística de distribución de mercaderías y paquetes en su último tramo cuando se traslada hasta el destino final de los mismos”, explica Soulignac.

Actualmente, ante el crecimiento de las ventas a través de canales digitales, los investigadores se centraron en estos problemas aplicados a la distribución de paquetes desde los negocios directo a los consumidores. “A nivel local, la coyuntura impuesta este año debido a la pandemia aceleró el proceso de compras online y, en consecuencia, los desafíos en términos logísticos”, explica el científico. “En nuestras investigaciones partimos de un modelo básico para el problema. Simplificadamente, el problema de ruteo de vehículos considera una flota de vehículos que debe ser utilizada para distribuir determinados paquetes a lo largo de la ciudad. Moverse de un cliente a otro tiene un costo asociado (monetario, ambiental, u otro) y buscamos determinar una ruta para cada camión de manera tal que se minimice el costo. Partiendo de esta idea simple de expresar, nuestro trabajo consiste en formular modelos matemáticos para estos problemas -que también tienen en cuenta mejores horarios para el traslado, congestión y otras variables- y estudiar propiedades de los mismos para luego traducir estos desarrollos en algoritmos (intuitivamente, programas de computadora) que puedan tomar como entrada los vehículos, los clientes, y encontrar un plan de distribución óptimo”.

Este proyecto, que ya había obtenido un financiamiento de Google en 2019 y que seguirán desarrollando con esta nueva beca LARA, reviste una gran relevancia científica y también promete aplicaciones prácticas, teniendo en cuenta que algunos trabajos estiman que la última milla representa aproximadamente un 40 por ciento del costo logístico total de un producto –si se contempla desde la producción del mismo hasta la efectiva distribución al consumidor final-, y que las proyecciones indican un crecimiento sostenido a mediano plazo en la incidencia de las ventas vía canales digitales.