INIFTA   05425
INSTITUTO DE INVESTIGACIONES FISICO-QUIMICAS TEORICAS Y APLICADAS
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Relaciones cuantitativas estructura-dulzor basadas en los métodos de clasificación N3 y PLSDA
Autor/es:
DAVIDE BALLABIO; PIERCOSIMO TRIPALDI; ROBERTO TODESCHINI; VIVIANA CONSONNI; CRISTIAN ROJAS; ANDREA MAURI; FRANCESCA GRISONI
Lugar:
Buenos Aires
Reunión:
Congreso; XXXI Congreso Argentino de Química; 2016
Resumen:
El objetivo de este trabajo fue el desarrollo de dos modelos preliminares basados en las relaciones cuantitativas estructura-actividad (QSARs) para clasificar moléculas dulces y no dulces. Se usó una base de datos de 649 compuestos (435 dulces y 214 no dulces). Para validación externa, la base de datos se dividió de forma casual y proporcional a la numerosidad de las clases en un grupo de calibración (70%) y predicción (30%). Para cada estructura se calcularon las huellas digitales de conectividad ampliada (ECFPs) [1] y los descriptores moleculares [2] independientes de la conformación mediante el programa Dragon [3]. Durante el análisis exploratorio de los datos, usando el escalado multidimensional (MDS) [4] y las ECFPs, se identificaron tres grupos consistentes de moléculas. Dos de estos grupos están bien definidos por moléculas dulces, mientras que el tercero agrupa las moléculas dulces y no dulces. Usando las 399 moléculas del tercer grupo y los 2130 descriptores se aplicó una reducción no supervisada de descriptores con el método V-WPS [5], seguido de una reducción supervisada basada en algoritmos genéticos [6] acoplado con los métodos de clasificación de los N-vecinos (N3) [7] y análisis discriminante de mínimos cuadrados parciales (PLSDA) [8]. Dos modelos con 6 descriptores cada uno fueron seleccionados por optimización de la tasa de aciertos (NER) en validación cruzada. Posteriormente, la capacidad predictiva de los modelos se midió usando el conjunto de moléculas de predicción. Los resultados para el modelo N3 (NERcal = 0.75, NERcv = 0.74, NERpred = 0.72) y el modelo PLSDA (NERcal = 0.72, NERcv = 0.71, NERpred = 0.70) indican buena capacidad de discriminación entre moléculas dulces y no dulces.