CCT CENPAT   26276
CENTRO CIENTIFICO TECNOLOGICO CONICET - CENTRO NACIONAL PATAGONICO
Centro Científico Tecnológico - CCT
congresos y reuniones científicas
Título:
Integración de Datos Semánticos, un camino hacia los Datos Abiertos Enlazados
Autor/es:
ZÁRATE, MARCOS; RENATO MAZZANTI; GUSTAVO D. SAMEC; CARLOS E. BUCKLE
Lugar:
Lima
Reunión:
Congreso; VIII Conferencia Internacional BIREDIAL-ISTEC; 2018
Institución organizadora:
Pontificia Universidad Católica de Perú
Resumen:
La Universidad Nacional de la Patagonia San Juan Bosco (UNPSJB), Argentina,se encuentra en proceso de implementación de su Repositorio Digital Institucionalde Acceso Abierto (RDI). En este contexto, se ha formulado un proyecto deinvestigación ? Infraestructura de Acceso a Datos Primarios con aporte desemántica en Repositorios Digitales ? que entre sus objetivos propone desarrollarmodelos y componentes para integrar las producciones científicas residentes en elRDI con los datos primarios que las sustentan. Dicho proyecto propone el uso detecnologías de la web semántica y estándares de la World Wide Web Consortium(W3C) para la definición de consultas integradas entre repositorios que faciliten eldescubrimiento de conocimiento a los investigadores.En este trabajo se exponen los avances de la etapa inicial del proyecto, queconsiste en enlazar publicaciones científicas con datos primarios citados en ellasutilizando Resource Description Framework (RDF). Se desarrolló una experienciaque vincula los metadatos de publicaciones científicas de DSpace con datasets delSistema Nacional de Datos Biológicos (SNDB). La propuesta se valida medianteconsultas integradas en Protocol and RDF Query Language (SPARQL),demostrando a su vez, las potencialidades de explotación semántica. Estosresultados permiten guiar el proyecto hacia la publicación de datos abiertosenlazados (Linked Open Data, LOD), que se presentan como el camino estándarhacia la integración de datos abiertos globales entre diferentes dominios.National University of Patagonia San Juan Bosco (UNPSJB), Argentina, is in the process of develop its Digital Institutional Repository (DIR). In this context, a research project called "Access Infrastructure to Primary Data with Semantic Contribution in Digital Repositories" has been formulated, among its objectives proposes to develop models and components to integrate the scientific productionsstored in DIR with the underlying primary data. This project proposes the use of semantic web technologies and World Wide Web Consortium (W3C) standards to define integrated queries between repositories to simplify the discovery of knowledge to researchers.In this paper we present the results of the initial stage of the project, which consists of linking scientific publications with primary data cited therein, to accomplish this,the information was stored in Resource Description Framework (RDF). An with datasets from the National Biological Data System (SNDB) previously converted to RDF. The proposal is validated through integrated queries usingProtocol and RDF Query Language (SPARQL), demonstrating the potential of semantic exploitation. These results allow conduct the project towards the publication of Linked Open Data (LOD), which is presented as the standard way towards the integration of global open data between different domains.