INVESTIGADORES
FRANCESCONI Javier Andres
congresos y reuniones científicas
Título:
Representación estructurada de compuestos orgánicos basada en autoencoders
Autor/es:
IGNACIO PEREZ CORREA; GIUNTA, PABLO D.; FRANCESCONI, JAVIER A.; MARIÑO, FERNANDO J.
Lugar:
San Juan
Reunión:
Congreso; 2022 IEEE Biennial Congress of Argentina (ARGENCON); 2022
Institución organizadora:
Sección Argentina del IEEE, el Instituto de Energía Eléctrica (IEE) de la Universidad Nacional de San Juan (UNSJ)/CONICET, y la Universidad de Palermo.
Resumen:
En este trabajo proponemos la utilización de unared de tipo autoencoder para procesar compuestos orgánicoscodificados en formato SMILES buscando evocarrepresentaciones significativas en el espacio latente y utilizarestas representaciones para generar modelos de predicción depropiedades. Fueron utilizados 400.000 compuestos codificadosmediante SMILES para el entrenamiento del autoencoder,dónde se encontró que una dimensión latente de 25 elementoslogra reconstruir los datos adecuadamente. A partir de esto, sedesarrollaron modelos de predicción para las 8 propiedadestermodinámicas de interés (presión crítica, temperatura crítica,volumen crítico, temperatura de fusión, temperatura deebullición y las entalpías de vaporización, fusión y formación).Para la regresión se utilizaron 1079 sustancias cuya capacidadde predicción también fue contrastada con el modelo de Jobacky Reid, referencia en predicción de propiedades. El modelopropuesto presenta errores del 1% al 6% para las distintaspropiedades (exceptuando el punto de fusión) que mejorannotablemente respecto del modelo de referencia que poseevalores en el entorno de (3-9) % para las mismas propiedades.Respecto del punto de fusión, se observa que ambos modelostienen dificultades en la estimación y que podría sugerir que serequieren otros indicadores para representar este fenómeno.