BECAS
PEREZ CORREA Ignacio
congresos y reuniones científicas
Título:
Representación estructurada de compuestos orgánicos basada en autoencoders
Autor/es:
PEREZ CORREA, I.; GIUNTA, P.; FRANCESCONI, J.; MARIÑO F.
Reunión:
Congreso; 2022 IEEE Biennial Congress of Argentina (ARGENCON); 2022
Resumen:
En este trabajo proponemos la utilización de una red de tipo autoencoder para procesar Compuestos orgánicos codificados en formato SMILES buscando evocar representaciones significativas en el espacio latente y utilizar estas representaciones para generar modelos de predicción de propiedades. Fueron utilizados 400.000 compuestos codificados mediante SMILES para el entrenamiento del autoencoder, dónde se encontró que una dimensión latente de 25 elementos logra reconstruir los datos adecuadamente. A partir de esto, se desarrollaron modelos de predicción para las 8 propiedades termodinámicas de interés (presión crítica, temperatura Crítica, volumen crítico, temperatura de fusión, temperatura de ebullición y las entalpías de vaporización, fusión y formación). Para la regresión se utilizaron 1079 sustancias cuya capacidad de predicción también fue contrastada con el modelo de Joback y Reid, referencia en predicción de propiedades. El modelo propuesto presenta errores del 1% al 6% para las distintas propiedades (exceptuando el punto de fusión) que mejoran notablemente respecto del modelo de referencia que posee valores en el entorno de (3-9) % para las mismas propiedades. Respecto del punto de fusión, se observa que ambos modelos tienen dificultades en la estimación y que podría sugerir que se requieren otros indicadores para representar este fenómeno.