INVESTIGADORES
RODA Fernando
congresos y reuniones científicas
Título:
HACIA UN ASISTENTE INTELIGENTE A LA INGENIERÍA LEGAL
Autor/es:
ANA CASALI; CLAUDIA DECO; FERNANDO RODA; JOEL CATACORA
Lugar:
Rosario
Reunión:
Jornada; XV Jornadas de Ciencias, Tecnología e Innovación de la Universidad Nacional de Rosario; 2021
Institución organizadora:
Universidad Nacional de Rosario
Resumen:
La definición y seguimiento del marco normativo de toda actividad empresarial es una tarea compleja que requiere muchas horas de trabajo de especialistas que deben conocer muy bien la actividad en cuestión y la normativa vigente. Las normas se publican en formato de texto plano en repositorios de acceso abierto gestionados por diversos organismos gubernamentales (ej. Boletín Oficial - BORA). Los especialistas que realizan este trabajo deben estar atentos a la modificación o aparición de nueva legislación. Sin embargo, la falta de estandarización e integración de datos normativos entre las diferentes jurisdicciones y organismos hace a esta tarea sumamente compleja, con una gran propensión a errores u omisiones. En vista del impacto que esto provoca en la gestión de la industria regional, en 2019 se inicia un proyecto de vinculación tecnológica con la empresa Smart Legal cuyo objetivo es desarrollar un sistema basado en técnicas de Inteligencia Artificial y Procesamiento del Lenguaje Natural para recuperar normas pertinentes a la actividad inherente a una determinada empresa, de modo de asistir de forma semiautomática al especialista legal con una herramienta escalable y productiva. Entre las actividades llevadas a cabo en este proyecto se  destacan: 1) El diseño de una arquitectura de software basada en el etiquetado semántico y la clasificación automática de documentos legales. 2) El análisis de fuentes de datos abiertos para la recuperación automática de normas: Se observaron las interfaces de acceso (APIs), el nivel de actualización de los datos, la composición de los datasets, los metadatos y la granularidad de los datos de fuentes como BORA, SAIJ (DNSAIJ) e InfoLeg. 3) El estudio de descriptores para la catalogación de documentación legal: Entre otros, se trabajó con los  tesauros de temas y ?Categorías del sistema judicial Argentino? de SAIJ. 4) El estudio de  herramientas de búsqueda y recomendación de normas relevantes para una actividad empresarial: Se generó un corpus para la realización de pruebas de búsquedas avanzadas tanto en Bases de Datos Relacionales (PosgreSQL) y como en Bases de Datos Documentales (Elasticsearch). Además, se han analizado distintos criterios de expansión de las búsquedas, mediante la utilización del tesauro y el dataset. Para ello, se implementaron algoritmos no supervisados para el cálculo de distintos tipos de similitudes entre términos basadas en información estadística (TF-IDF) y sobre tesauros (Resnik, por ej.). 5) El modelado de la actividad empresaria: Como caso de estudio, se realizó un relevamiento de la actividad de una empresa aceitera de la región y se propusieron vocabularios controlados y ontologías estándares para el modelado tanto de la empresa como de la metadata del corpus de normas asociado.  Como resultado, las actividades realizadas permitieron concluir un estudio de factibilidad y asistir en el desarrollo de un prototipo MVP (producto mínimo viable) para el mencionado sistema.