INVESTIGADORES
NIETO Alejandro agustin
congresos y reuniones científicas
Título:
La historia social y las ciencias computacionales. Notas técnicas sobre una investigación en curso
Autor/es:
LAITANO, GUILLERMINA; NIETO, ALEJANDRO AGUSTÍN
Lugar:
Mar Del Plata
Reunión:
Jornada; XIII Jornadas de Investigadores en Historia; 2021
Institución organizadora:
Centro de Estudios Históricos
Resumen:
En los primeros veinte años del siglo XXI los archivos nacidos digitales crecieron de manera exponencial. Hace tiempo que estos archivos se han introducido como fuentes en el campo de la historia social, pero se ha hecho en gran medida bajo las técnicas tradicionales. Si tenemos en cuenta que hoy se producen 2,5 billones de bytes de datos diarios, se evidencia que el llamado giro digital habilita nuevas formas de conocer el pasado, siempre y cuando asumamos los desafíos teórico-metodológicos implícitos. Uno de ellos tiene que ver con poner en relación la disciplina histórica con las ciencias de la computación, de forma de desarrollar técnicas computacionales que nos permitan ensayar lecturas escalares de grandes masas de fuentes históricas.Este es el desafío asumido en el presente trabajo. El objetivo es presentar la estrategia metodológica -computacional y basada en la minería de textos- desarrollada para estudiar la conflictividad barrial en la ciudad de Mar del Plata en el periodo 2006-2021. En primer lugar, presentamos las técnicas computacionales en lenguaje R utilizadas para la recolección y análisis de la información semiestructurada disponible en el sitio web del diario La Capital, nuestra fuente histórica. En un segundo momento, presentamos el desarrollo de código que nos permitió realizar una crítica de la fuente, de forma de detectar sesgos en la producción de noticias, detección fundamental para tomar las decisiones más eficientes durante el momento de construcción y análisis de los datos.En el primer apartado presentamos el conjunto de técnicas y elementos desarrollados para recolectar la información y producir los datos de forma automatizada. Mediante el desarrollo de código de programación en lenguaje R, recuperamos de la web la totalidad de noticias publicadas por el diario La Capital en su versión web desde 2006 hasta 2021. Luego, estructuramos esa información en una base de datos en función de un conjunto de variables (id, fecha, sección, título, bajada, nota, link). En tercer lugar, presentamos algunos de los elementos de la técnica del procesamiento de lenguaje natural utilizados para la producción de datos (diccionarios, tokenización, lematización). Finalmente, a lo largo de esta reconstrucción de la estrategia metodológica, ponderamos un conjunto de virtudes que el abordaje computacional presenta en relación a métodos y técnicas tradicionales.En el segundo apartado, realizamos una lectura crítica de la información proporcionada por la fuente, también a partir del tratamiento computacional de los datos. Pudimos apreciar de esta forma años problemáticos en cuanto a la producción de noticias, ya sea por la cantidad de notas publicadas o por la cantidad de valores atípicos. Detectar estos problemas nos llevó a tomar la decisión de descartar de los análisis de series temporales los años más problemáticos en cuanto a caudal de publicación de noticias (2006, 2007 y 2008), además de trabajar con valores relativos siempre que se realicen comparativas entre años o períodos de tiempo.De conjunto, el escrito apuntó a presentar parte de la ‘cocina’ de la investigación historiográfica cuantitativa sobre la conflictividad social, en el contexto actual del giro digital. En 1968 Le Roy Ladurie sostuvo que en una década “todo historiador interesado en la historia cuantitativa ‘será programador o no serᒔ. A lo largo del medio siglo transcurrido desde la observación del historiador francés, optar por el desarrollo de nuestras pesquisas desde el mundo de la programación fue una opción entre otras. Hasta no hace tantos años se podía practicar la historia sin contacto con el mundo digital, pero hoy ese vínculo se ha vuelto imprescindible. La transdisciplinariedad entre la historia y las ciencias de la computación se nos presenta insoslayable. En este sentido, este trabajo pretende ser un aporte al desafío al que asistimos lxs investigadores en la tarea de interseccionar historiografía y lenguajes de programación.