INVESTIGADORES
TALEVI Alan
congresos y reuniones científicas
Título:
APRENDIZAJE POR ENSAMBLADO APLICADO A LA BÚSQUEDA DE NUEVOS INHIBIDORES DE CRUZIPAINA
Autor/es:
JUAN I. ALICE; LUCIANA PIQUÉ; VALENTINA HANSEN; ALAN TALEVI; CAROLINA L. BELLERA
Lugar:
Buenos Aires
Reunión:
Congreso; XXXII Congreso Argentino de Química; 2019
Institución organizadora:
Asociación Química Argentina
Resumen:
La enzima cruzipaína es la principal cisteína-proteasa proteolítica delTrypanosoma cruzi, se expresa en todos los estadios de su ciclo de vida; debido a que no presenta homólogos en mamíferos es considerada un blanco terapéutico atractivo para el desarrollo de nuevos tratamientos de la enfermedad de Chagas1.Metodología: El aprendizaje por ensamblado (ensemble learning) utiliza múltiplesalgoritmos de aprendizaje para obtener mejores desempeños predictivos que los que podría obtener de forma individual2. Se ha demostrado que los clasificadores por ensamble proveen una mejor generalización y precisión que los clasificadoresindividuales3,4; para realizar estos ensambles de modelos, hemos utilizado 5 esquemas diferentes de combinación del score: promedio del ranking, máximo, mínimo, promedio y promedio del voto. La validación de los modelos obtenidos se realizó mediante técnicas de validación estándar y la selección de un valor de corte adecuado se llevó a cabo mediante la confección y el análisis de gráficas de superficie de Positive Predictive Value (PPV).Resultados: A partir de datos de actividad disponibles en ChEMBL complementados con compilación bibliográfica se generó y curó una base de datos de 533 compuestos evaluados sobre la enzima. Mediante el entorno R se generaron 1000 modelos clasificadores lineales capaces de discriminar compuestos con o sin actividad inhibitoria sobre la enzima. Los 10 mejores modelos individuales se combinaron en un ensamble de modelos mediante el operador mínimo. A fin de validar la combinación de modelos,se realizó un cribado in silico sobre una librería de compuestos conteniendo unapequeña proporción de inhibidores conocidos dispersos entre señuelos generadosmediante la aplicación DUD-E5. Las métricas calculadas para el ensamble fueron,AUCROC=0.938±0.021, BEDROC= 0.557, FE%1= 21.965. Mediante el análisis degráficas de superficie del PPV optimizamos el valor de corte del score de manera de disminuir considerablemente la probabilidad de encontrarnos con falsos positivos. El mejor ensamble se aplicó al cribado virtual de las bases de datos DrugBank 4.06 y Sweetlead7 dando como resultados la identificación de 36 compuestos químicos (6 de estos fármacos aprobados) con posible actividad tripanocida para un PPV>20%.