INVESTIGADORES
CRAVERO Fiorella
congresos y reuniones científicas
Título:
Modelado QSPR de Propiedades Mecánicas de Materiales Poliméricos empleando Técnicas de Reducción de Variables basadas en Algoritmos de Aprendizaje Automático (20 Pag)
Autor/es:
CRAVERO, FIORELLA; VAZQUEZ, GUSTAVO, E.; DÍAZ, MÓNICA F.; PONZONI, IGNACIO
Lugar:
CABA, Buenos Aires
Reunión:
Congreso; Congreso Argentino de Ingeniería Química; 2015
Institución organizadora:
Asociación Argentina de Ingenieros Químicos (AAIQ)
Resumen:
El desarrollo de modelos QSPR (Quantitative Structure-Property Relationship), constituye una de las áreas más activas de desarrollo en el campo de la Informática Molecular. Estos modelos permiten predecir distintas propiedades de interés en el estudio y diseño de compuestos químicos, y son ampliamente utilizados para la experimentación in silico en diferentes campos de la industria, tales como la biotecnología, la industria farmacéutica y el diseño de materiales, entre otros dominios de aplicación.En general, el diseño de estos modelos QSPR requiere transitar una etapa de selección de variables relevantes para la definición del modelo, la cual implica evaluar la potencial contribución al modelo de centenares (o incluso miles) de descriptores moleculares diferentes. Por otra parte, en algunos contextos particulares, esta tarea puede resultar aún más ardua debido a las características intrínsecas de los compuestos químicos involucrados en el estudio. Este es el caso del diseño de materiales poliméricos, donde las moléculas suelen ser altamente complejas y de gran dimensión. En este contexto, ya la simple tarea de computar los descriptores moleculares requeridos para efectuar la selección resulta en sí un proceso computacionalmente muy costoso, y a veces incluso inviable.Por esta razón, han surgido en el campo del modelado QSPR diversas técnicas de transformación y proyección entre dominios, tales como el método que combina los algoritmos CODES y TSAR (Dorronsoro et al., 2004). Esta metodología, mediante el uso de redes neuronales genera un nuevo conjunto muy reducido de características, las cuales capturan información derivada de la estructura molecular de los compuestos sin necesidad de atravesar un proceso clásico de selección de descriptores.Dada una base de datos de compuestos, el primer paso de la metodología CODES-TSAR consiste en describir la molécula estructuralmente mediante su código SMILES (Simplified Molecular Input Line Entry Specification). Como segundo paso, este código ingresa a la herramienta CODES, la cual genera una matriz dinámica. Dicha estructura contiene tantas columnas como número de átomos diferentes a hidrógeno contenga la molécula y tantas filas como sea necesario hasta lograr su estabilización. Luego, esta matriz numérica ingresa a la herramienta TSAR encargada de realizar una reducción de dimensionalidad a través de una red neuronal, donde el usuario define la cardinalidad de la dimensión proyectada. Repitiendo este análisis para cada molécula se obtiene una tabla de descriptores con dimensión reducida.No obstante el buen desempeño evidenciado por la metodología CODES-TSAR en el estudio de compuestos químicos de interés farmacéutico o biológico, su efectividad nunca ha sido testeada en el diseño de polímeros sintéticos. Por esta razón, se propone en este trabajo explorar los alcances y limitaciones de esta estrategia en la inferencia de modelos QSPR para propiedades mecánicas relevantes en el diseño de materiales. Al respecto, se presentan y discuten resultados preliminares obtenidos para una base de datos integrada por 67 polímeros, donde se estudio del ensayo de tracción, específicamente en el punto de quiebre (tensile strength at break). El desempeñoobtenido fue contrastado con modelos QSAR obtenidos mediante estrategias tradicionales de selección de descriptores.