BECAS
PETITTI TomÁs Denis
congresos y reuniones científicas
Título:
SOLVING THE BACILLUS CEREUS AND BACILLUS THURINGIENSIS TAXONOMICAL INCOHERENCIES BY GENOME SCALE AND MACHINE LEARNING APPROACHES
Autor/es:
PETITTI, TOMAS; TORRES MANNO, MARIANO ALBERTO; DAURELIO, LUCAS DAMIAN; ESPARIZ, MARTÍN
Reunión:
Congreso; V Congreso Argentino de Microbiología Agrícola y Ambiental; 2021
Institución organizadora:
Asociación argentina de microbiología y Universidad Nacional de la Plata
Resumen:
El Clado 2 del grupo Bacillus cereus, está compuesto por las genomoespecies Bacillus thuringiensis y B.cereus sensu stricto. Como las genomoespecies son agrupamientos de cepas basados en rasgos genómicos, estos pueden no coincidir con las definiciones de especies basadas en fenotipos. Por ejemplo, la especie B. thuringiensis se diferencia de B. cereus sensu stricto por su capacidad de producir cristales Cry, los cuales son importantes para la patogenicidad bacteriana contra invertebrados, siendo esta la base de su uso para el control de plagas. Sin embargo, la codificación plasmídica de los genes cry dio lugar a inconsistencias taxonómicas que dificultan los estudios comparativos. Con el fin de generar clasificadores que rápidamente permitan asignar la genomoespecie con alta precisión, utilizamos el método de machine learning Random Forest (RF) para la evaluación de genes marcadores. Para esto, descargamos 2460 secuencias del grupo B.cereus de GenBank, a las cuales se les aplicaron diferentes criterios de calidad para evitar incluir secuencias genómicas incompletas o con imprecisiones. Para lo cual se utilizaron los parámetros de N50, número de contigs y el tamaño total del genoma, obteniendo así 2191 secuencias de buena calidad. Luego, para seleccionar aquellos genomas correspondientes a B. thuringiensis y B. cereus sensu stricto, se realizó un análisis de Identidad Nucleotídica Promedio (ANI en inglés) contra las cepas tipo B. thuringiensis ATCC 10792 y B. cereus sensu stricto ATCC 14579, obteniendo 863 secuencias pertenecientes a Clado 2, por otro lado, se verificó la identidad obtenida, a partir de la generación de un árbol filogenético utilizando 104 genes ancestrales comunes, utilizando los outgroups B. anthracis Ames Ancestor y B. mycoides ATCC 6462. Posteriormente, para la generación de clasificadores basados en RF se utilizaron como variables 22 marcadores taxonómicos, tradicionalmente reportados para este clado. Se seleccionó un grupo de entrenamiento de 697 secuencias para generar clasificadores, de diez, cien y mil árboles, para cada uno de los marcadores taxonómicos. Once genes generaron clasificadores que mostraron una precisión y valor kappa de 1 (clasificación perfecta del grupo de entrenamiento). Finalmente, se calculó el error de estos clasificadores sobre el grupo de evaluación. Se comprobó que no había clasificaciones incorrectas indicando que los clasificadores no están sesgados y poseen una precisión observada perfecta. De esta manera, en este estudio hemos determinado que estos 11 clasificadores permiten establecer la genomoespecie de un aislamiento en estudio de manera rápida y precisa, utilizando solamente la información de un gen marcador. Esta clasificación permitirá realizar estudios de genómica comparativa, siendo este un aspecto central para la comprensión de los distintos comportamientos patológicos de las bacterias del Clado 2 frente a distintos hospedadores, incluyendo el humano.