
En esta oportunidad, el Observatorio de Violencia de Diálogos, Guatemala presentó su experiencia en torno al uso de ChatGPT para automatizar, sistematizar y agilizar el monitoreo de medios en torno a la conflictidad y la violencia electoral.
La experiencia fue presentada por:
- Karla López, Investigadora, Observatorio de Violencia, Diálgos (Guatemala)
- Rudik Rompich, Asistente de Datos, Diálogos (Guatemala)
El Observatorio de Violencia viene dando seguimiento y analizando los datos sobre homicidio, extorsión y la violencia contra la mujer dede 2018. A partir de la experiencia adquirida, en 2023 formó parte de la Mision de Observación Electoral para monitorear la violencia y conflictividad electoral en el país.
El objetivo fue recolectar todos los hechos de violencia y conflictividad electoral que sucedieran durante la campaña. Se diferenció entre violencia electoral y conflicto electoral. Se utilizaron datos electorales de la Fiscalía, registros de la Procuraduría de Derechos Humanos, reportes de una red de 30 observadores e incidentes cubiertos por los medios de comunicación. Para capturar esos últimos incidentes, el Observatorio de Violencia desarrolló un sistema automatizado de monitoreo de medios sobre la base de ChatGPT.
El sistema se desarrolló con base en los siguientes pasos:
- Establecer las definiciones de violencia y conflicto electoral.
- Seleccionar los medios digitales que serán consultados.
- Hacer “web scraping” para identificar las noticias relevantes. Descargar y almacenar las notas con sus respectivos metadatos.
- Dada la cantidad de notas identificadas, hubo que hacer una preclasificación. Para ello los/as investigadores/as generaron una lista de verbos, sustantivos y adjetivos asociados con la violencia electoral.
- Una vez realizada la preclasificación, se procedió a usar el API de ChatGPT para hacer las consultas por medio de una serie de instrucciones.
- De esta manera se generó una base de datos con noticias seleccionadas, que cumplían con los criterios establecidos. Cada registro contaba con fecha, título, enlace de la noticia, una clasificación larga y una clasificación corta, víctima y victimario.
Hay que tener en cuenta que la cantidad de registros de los medios no corresponde a la cantidad total de hechos, porque solo cubren los más relevantes y en algunas zonas, y algunos hechos son cubiertos por más de un medio. Esto hizo que fuera necesario limpiar y consolidar la base para evitar la duplicación.
Los datos consolidados se pusieron a disposición del público a través de un tablero de información.
Para acceder a los materiales de la Sesión, haga clic aquí.