BECAS
RODRÍGUEZ MarÍa Florencia
congresos y reuniones científicas
Título:
Distribución de un analizador de contenido de Twitter utilizando el framework Hadoop
Autor/es:
MARÍA FLORENCIA RODRÍGUEZ
Lugar:
La Plata
Reunión:
Jornada; V Jornadas de Cloud Computing y Big Data; 2016
Resumen:
En este trabajo, presentamos la utilización de una plataforma distribuida para analizar diversas estrategias de creación de perfiles de usuario basadas en los intereses extraídos de los tweets. Estudiamos cómo esto beneficia la comprensión semántica de las actividades en Twitter, empleándolos como motores para la recomendación de contenido, y medimos los resultados en términos de tasa de error, exactitud y valor F. Posteriormente, proponemos la creación de perfiles de usuario combinando las estrategias planteadas con el objetivo de obtener un modelo más preciso. Para mejorar la eficiencia del cálculo, dada la gran cantidad de datos, proponemos el uso de un entorno distribuido bajo un modelo de programación Map-Reduce, con la finalidad de reducir los tiempos de análisis de información y llevar a cabo el procesamiento de texto de manera paralela.