PERSONAL DE APOYO
CASAL Juan Jose
congresos y reuniones científicas
Título:
Extracción automatizada de información de publicaciones médicas mediante minería de textos: una nueva forma de revisar y seleccionar la bibliografía para actualizar temas de enseñanza
Autor/es:
JUAN JOSÉ CASAL; DORR, RICARDO A.; DAIANA GIOIA; TORIANO, ROXANA
Reunión:
Encuentro; VI Encuentro de Docentes de Fisiología y Física Biológica; 2021
Institución organizadora:
Sociedad Argentina de Fisiología (SAFIS)
Resumen:
Con el auge de Internet, la cantidad de literatura médico-científica disponible para los docentes-investigadores que pretendan actualizar sus conocimientos en un tema determinado, es abrumadora. El creciente número de publicaciones mundiales hace cada vez más necesario disponer de sistemas automatizados para extraer información de ellas. El objetivo del presente trabajo fue diseñar una metodología que, utilizando la Minería de Textos (MT) como herramienta, permita procesar una gran base de datos científicos con el fin de obtener e integrar información en ciencias de la vida. Métodos: La MT se aplicó de forma accesible sobre los datos proporcionados por Europe PMC (ePMC) utilizando la plataforma KNIME. Resultados: Para cualquier tema de las ciencias de la vida, la MT permitió obtener una visión integradora sobre: i) número de publicaciones por año; ii) autores involucrados de la investigación; iii) número de trabajos publicados por cada autor; iv) análisis de afiliación; v) participación cuantitativa de las revistas que publicaron los trabajos. Además, la MT de los resúmenes permitió i) la construcción de bolsas de palabras y el estudio de su frecuencia y uso temporal; ii) la extracción no supervisada de los temas tratados; iii) la búsqueda de relaciones entre enfermedades, prevención y tratamiento, cruzando la información con la de otras fuentes. Conclusiones: Siguiendo las instrucciones del tutorial, los docentes e investigadores sin conocimientos de programación pueden realizar con éxito la MT a partir de la literatura científica indexada. Esta metodología podría convertirse en una herramienta útil para realizar estadísticas, analizar comportamientos, seguir tendencias y hacer predicciones sobre temas de interés. Entre otras muchas ventajas, es de gran utilidad para integrar información científica y ayudar a realizar revisiones.