BECAS
ROJAS matias Gabriel
artículos
Título:
MODELO DE ANÁLISIS DE INFORMACIÓN DESESTRUCTURADA UTILIZANDO TÉCNICAS DE RECOPILACIÓN Y MINERÍA WEB
Autor/es:
KARANIK MARCELO JAVIER; SUENAGA ROBERTO; ROJAS MATIAS GABRIEL; PFEIFER, HERNAN ARIEL
Revista:
Revista de investigación y desarrollo de la Universidad Gastón Dachary
Editorial:
Editorial UGD
Referencias:
Lugar: Posadas; Año: 2019 p. 27 - 30
ISSN:
2591-3778
Resumen:
Cuando se hacen búsquedas de información en internet, saber exactamente lo que se busca es primordial para localizar rápidamente lo que se requiere. Pero cuando lo que se necesita es identificar qué documentos hay acerca de un tema en particular (sin identificar su denominación precisa), los buscadores identifican infinidad de sitios y documentos que hace casi imposible revisarlos individualmente hasta dar con aquellos que se acercan a lo que al usuario le interesa.Esa situación requiere de soluciones especializadas que utilicen técnicas de interpretación de contenido de páginas web y documentos de internet que, a partir de una especificación de lo requerido por el usuario, busque, analice y clasifique la información disponible de acuerdo a lo solicitado.Este trabajo aborda la situación descrita precedentemente, a partir del cual se propone desarrollar y utilizar un modelo para el proceso de identificación de sitios y documentos, basado en la integración de técnicas de recopilación, exploración y análisis de información en la web.Primeramente se describen las características de los procesos de identificación de información en internet, como así también las métricas de evaluación que permiten identificar la relevancia de la información de interés.En el desarrollo del trabajo se propone un modelo correspondiente a un proceso que consiste en la utilización de resultados de los buscadores de internet (Google, Bing, MSXML Excite e Intelligo), a partir del cual se desencadena un proceso de exploración de los enlaces de cada sitio identificado, para luego proceder a asignar puntajes de acercamiento a los requerimientos del usuario (uno de los parámetros significativos es asignado por el análisis semántico), finalmente se ordenan los documentos de acuerdo a los valores asignados (raniking).El modelo se probó en dos escenarios, uno referido a información sobre herramientas de educación digital y el segundo referido a información sobre técnicas vinculadas con seguridad informática. Las pruebas del modelo proporcionaron ordenamientos que ubicaron mejor a los recursos más relevantes en los rankings construidos, los que fueron validados por usuarios especializados que configuraron los escenarios de búsqueda inicial.