ICIC   25583
INSTITUTO DE CIENCIAS E INGENIERIA DE LA COMPUTACION
Unidad Ejecutora - UE
congresos y reuniones científicas
Título:
Mejora del acceso a Infoleg mediante técnicas de procesamiento automático del lenguaje
Autor/es:
CARDELLINO, FERNANDO; SOTO, AXEL J.; VILLATA, SERENA; CARDELLINO, CRISTIAN; TERUEL, MILAGRO; HAAG, KAREN; ALONSO ALEMANY, LAURA
Reunión:
Congreso; Simposio Argentino de Informática y Derecho; 2018
Institución organizadora:
JAIIO
Resumen:
En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualmente. Presentamos un análisis de los diferentes tipos de entidades que se encuentran en los textos, sus realizaciones lingüísticas y sus dificultades para el análisis automático. El diseño de la solución se basa en las dificultades propias de estas entidades. En la fase actual de desarrollo de la aproximación hemos anotado manualmente una porción del corpus y hemos desarrollado reglas para anotar casos sencillos automáticamente. Hemos entrenado y evaluado una aproximación basada en aprendizaje automático para casos sencillos, con resultados muy prometedores.