INVESTIGADORES
DUCHOWICZ Pablo Roman
congresos y reuniones científicas
Título:
Estudio QSPR Sobre Solubilidades Acuosas de Sustancias Orgánicas
Autor/es:
DUCHOWICZ, P. R.; TALEVI, A.; BELLERA, C.; CASTRO, E. A.; BRUNO-BLANCH, L. E.
Lugar:
San Luis
Reunión:
Congreso; XXVI Congreso Argentino de Química Dr. Ángel del Carmen Devia; 2006
Resumen:
Introducción La estrategia actual aplicada en el diseño racional de una droga1 incluye que esta sea capaz de exhibir una serie de propiedades fisicoquímicas deseables durante su ciclo de desarrollo, que permitan obtener un compuesto activo caracterizado por poseer bio-disponibilidad y perfil de toxicidad adecuados. Esto resulta de suma importancia, especialmente durante los primeros pasos del descubrimiento del fármaco tales como identificación del líder y su posterior optimización.   La “regla de cinco” de Lipinski establece que para que un compuesto pueda ser suministrado oralmente, este debe cumplir con al menos tres de las siguientes condiciones: (a) poseer un peso molecular por debajo de 500; (b) no tener más de 5 átomos donores de enlace de hidrógeno; (c) poseer un coeficiente de partición octanol-agua debajo de 5; y (d) no tener más de 10 átomos aceptores de enlace de hidrógeno. Si dos o más de estos parámetros se encuentran fuera de rango, entonces es muy probable que el compuesto presente, o bien escasa solubilidad (cuando excede los valores críticos de coficiente de partición o peso molecular) o bien una pobre absorción y permeabilidad (cuando excede los valores críticos correspondientes a número de donores y aceptores de hidrógeno)2.   La regla de Lipinski expresa el hecho conocido de que la biodisponibilidad oral supone un balance entre la solubilidad acuosa del compuesto activo y su habilidad para difundir pasivamente a través de diferente tipo de membranas biológicas. La solubilidad controla tanto la velocidad de disolución como la concentración máxima alcanzada por la sustancia en el fluido gastrointestinal, factores ambos que contribuyen a la velocidad de absorción. Sin embargo, moléculas excesivamente polares resultarán problemáticas en su paso a través de mencionadas barreras biológicas (membrana gastrointestinal, barrera hematoencefálica). Esta propiedad fisicoquímica también es crítica para la metabolización y tiempos de eliminación, que resultan ser más cortos en drogas hidrosolubles, y por tanto se espera menores toxicidades y efectos colaterales si la solubilidad acuosa de la droga se incrementa3,4.   En la actualidad se ha propuesto un gran número de modelos teóricos para la predicción de solubilidades acuosas. Desde los primeros estudios realizados por Yalkowsky y col.5 en la década del setenta, varias aproximaciones se introdujeron incluyendo cálculos termodinámicos, aditividad de grupos funcionales, y regresiones lineales2,5-9. Las diversas formulaciones de las Relaciones Cuantitativas Estructura-Propiedad (QSPR) proponen modelos matemáticos capaces de cuantificar y describir una hipotética relación entre la estructura molecular y la solubilidad acuosa de sustancias:   p = función (d)   donde la respuesta p representa la solubilidad acuosa determinada experimentalmente, mientras que d denota un conjunto de descriptores moleculares que caracterizan la estructura/subestructura molecular. Los descriptores habitualmente representan variables numéricas que pueden ser propiedades físico-químicas determinadas experimentalmente o cantidades teóricas derivadas, por ejemplo, de la Teoría de Grafos Química o la Mecánica Cuántica10,11.   El presente estudio sobre solubilidades acuosas de compuestos orgánicos emplea el método estadístico de Análisis de Regresión Lineal Multivariable (MLR) para establecer relaciones QSPR, y utiliza un conjunto molecular representativo de 148 moléculas orgánicas que exhiben diversidad estructural.                                                               Metodología          Se calculan 1300 descriptores teóricos de diferente tipo mediante el programa Dragon12, pudiéndose clasificar como pertenecientes a las siguientes familias de variables: constitucionales, topológicos, cuenta de caminos moleculares, autocorrelaciones bidimensionales, geométricos, de carga, funcionales, de tipo Randic, funciones de distribución radial, etc. Los descriptores dependientes de la geometría tridimensional se obtienen luego de optimizar las estructuras con el método semiempírico PM3, disponible del programa Hyperchem13. El gradiente de convergencia empleado es 0.01 kcal.Å-1. Por otro lado, también se incorporan al estudio nuevos descriptores derivados de otros ya conocidos obtenidos a partir de la matriz Detour (también conocida como matriz de distancias topológicas máximas), y que son capaces de reunir varios parámetros de la regla de Lipinski en una única variable.14   Es bien sabido el hecho de que cada uno de estos descriptores moleculares son capaces de contribuir en cierto grado para explicar la propiedad estudiada. Sin embargo, la selección de un conjunto reducido de descriptores que sean más representativos de la propiedad estudiada y que minimicen su desviación estándar (S), no es una tarea trivial en el momento de establecer un modelo válido. Un cálculo exacto implica realizar el siguiente número de regresiones lineales: D! / [(D-d)!d!], donde D es el número total de descriptores disponibles y d es el número de variables presentes en la ecuación, es decir, tratar todas las combinaciones posibles entre los descriptores en el modelo lineal. Existe una diversidad de métodos aproximados reportados en la literatura que permiten buscar el modelo óptimo de regresión. En el presente análisis se ha recurrido al Método del Reemplazo (RM)15-17, una técnica eficiente, propuesta en nuestro grupo y que requiere un número mucho menor de cálculos a realizar, cuyos resultados son comparables a  los ampliamente reconocidos Algoritmos Genéticos18. En breve, la esencia del método del Reemplazo consiste en minimizar el parámetro S del modelo tomando en consideración la desviación estándar relativa en cada coeficiente de regresión del modelo de d variables. Este es el trayecto de optimización que considera el algoritmo. Las variables que presenten mayores desviaciones relativas en sus contribuciones son reemplazadas continuamente, por etapas, por otras del conjunto total D, de manera que mejoren sucesivamente la calidad de la ecuación lineal.   Con la idea de establecer el poder predictivo de las relaciones encontradas, se practica una validación externa del modelo seleccionado. Para ello, se particiona el conjunto molecular de 148 moléculas orgánicas en dos subconjuntos, 100 moléculas para calibrar el modelo y buscar los mejores descriptores con RM, y las restantes 48 moléculas para aplicar el modelo y analizar su performance predictiva.   Resultados El método RM encuentra diferentes modelos óptimos que relacionan las solubilidades acuosas con las estructuras moleculares de los 100 compuestos orgánicos. Para el caso de 6 descriptores elegidos entre las 1369 variables disponibles, se tiene la siguiente estadística:   log(S[mg.ml-1]) = 15.829 + 0.412 C-006 + 0.246 nHDon - 13.789 HATS1p                        - 13.257 FDI - 2.347 C-039 - 4.576 H3p                                             (2) N=100 R=0.8951 S=0.804 F=62.491 N=38 Rval=0.7583 Sval=1.080                                               donde se aprecia que son necesarios descriptores teóricos pertenecientes a distintos grupos de descriptores para predecir los valores de log(S). El modelo incluye descriptores constitucionales (C-006: número de fragmentos –CH2RX y C-039: número de fragmentos ArC(=X)R, siendo X en ambos casos un heteroátomo y R un sustituyente alquílico) y descriptores dependientes de la geometría tridimensional (tales como los descriptores GETAWAY de Todeschini HATS1p y H3p, que combinan información geométrica con información topológica procedente del grafo molecular19 y el Folding Degree Index FDI definido por Randic20). A su vez, el modelo verifica el resultado experimental observado que el número de átomos donores de enlaces hidrógeno (nHDon) juega un rol importante a la hora de describir la propiedad estudiada. Los parámetros de validación (val) sugieren que esta relación QSPR se desempeña predictivamente sobre 38 compuestos con solubilidades experimentales no tenidas en cuenta durante el ajuste de la Ec. (2).   Conclusiones Se analizan alrededor de 1369 definiciones de descriptores teóricos (incluyendo descriptores recientemente definidos en nuestro grupo de trabajo) por medio de la técnica RM para establecer un modelo que permita predecir solubilidades acuosas de compuestos orgánicos, sólo en base del conocimiento de la estructura molecular. El modelo encontrado demuestra generar predicciones satisfactorias de la propiedad fisicoquímica cuando se predicen moléculas estructuralmente relacionadas y que no fueron tenidas en cuenta durante el ajuste.       Agradecimientos. P. Duchowicz agradece al CONICET. Talevi A. agradece al CONICET por su beca de posgrado de tipo I. E. A. Castro es miembro del CONICET. L. E. Bruno-Blanch es investigador de la Facultad de Ciencias Exactas (Universidad Nacional de La Plata) y agradece los fondos de la Agencia de Promoción Científica y Tecnológica (PICT 06-11985/2004) y la Universidad Nacional de La Plata. Agradecemos a la estudiante de grado C. Bellera por su colaboración en este trabajo.   Referencias (1)       Yu, H., Adedoyin, A. DDT 2003, 8, 852. (2)       Lipinski, C. A., Lombardo, F., Dominy, B. W., Feeney, P. J. Adv. Drug Deliv. Rev. 2001, 46, 3. (3)       Hansch, C., Bjorkroth, J. P., Leo, A. J. Pharm. Sci. 1987, 76, 663. (4)       Smith, C. J., Hansch, C. Food Chem. Toxicol. 2000, 38, 637. (5)       Amidon, G. L., Yalkowsky, S. H., Anik, S. T., Valvani, S. C. J. Phys. Chem. 1875, 79, 2239. (6)       Katritzky, A. R., Maran, U., Lobanov, V. S., Karelson, M. J. Chem. Inf. Model. 2000, 40, 1. (7)       McFarland, J. W. J. Chem. Inf. Model. 2001, 41, 1355. (8)       Klopman, G., Wang, S., Balthasar, D. M. J. Chem. Inf. Model. 1992, 32, 474. (9)       Pogliani, L. J. Chem. Inf. Model. 1996, 36, 1082. (10)     Trinajstic, N. Chemical Graph Theory; CRC Press: Boca Raton, FL, 1992. (11)     Katritzky, A. R., Lobanov, V. S., Karelson, M. Chem. Soc. Rev. 1995, 24, 279. (12)     DRAGON 5.0 (Evaluación) , disponible de<http://www.disat.unimib.it/chm>. (13)     HYPERCHEM (Hypercube) disponible de <http://www.hyper.com>. (14)     Talevi, A., Castro, E. A., Bruno-Blanch, L. E. J. Arg. Chem. Soc. Aceptado para su publicación. (15)     Duchowicz, P. R., Castro, E. A., Fernández, F. M., González, M. P. Chem. Phys. Lett. 2005, 412, 376. (16)     Duchowicz, P. R., Castro, E. A., Fernández, F. M. MATCH Commun. Math. Comput. Chem. 2006, 55, 179. (17)     Helguera, A. M., Duchowicz, P. R., Pérez, M. A. C., Castro, E. A., Cordeiro, M. N. D. S., González, M. P. Chemometr. Intell. Lab. 2006, 81, 180. (18)     So, S. S., Karplus, M. J. Med. Chem. 1996, 39, 1521. (19)     Consonni, V., Todeschini R., Pavan M. J. Chem. Inf. Sci. 2002, 42, 682. (20)     Randic M., Kleinder A. F., DAlba L. M. J. Chem. Inf. Sci. 1994, 34, 277.