Gracias a la creación de un software propio, esta Comisión puede procesar y clasificar a gran velocidad los cerca de 15 mil documentos de archivo que ha logrado recopilar en su proceso de construir un relato de verdad sobre el conflicto armado.

 

Por: Pompilio Peña Montoya

Foto: cortesía Comisión de la Verdad 

Andrés Medina, experto en metodologías de investigación cuantitativa en ciencias sociales, es la persona encargada de coordinar el Sistema de Información de la Comisión de la Verdad en Colombia. Este sistema almacena los archivos y los datos provenientes de cientos de fuentes que tienen como propósito revelar información sobre lo sucedido durante el conflicto armado en periodos de tiempo y lugares concretos. Andrés dirige un equipo multidisciplinar encargado de construir las metodologías con las que son tratadas las informaciones dentro de un software que permite organizar una gran cantidad de material imposible de manipular si la Comisión hubiese trabajo de forma análoga.

Medina habló con Hacemos Memoria acerca de este ejercicio que reúne técnicas novedosas en torno a la tecnología, como la ciencia de datos, las humanidades digitales y la inteligencia artificial, reveló más detalles de este proyecto, único en el mundo, en el que confluyen al menos 15 mil materiales de archivo, entre entrevistas, documentos, investigaciones, base de datos, gráficas y estadísticas.

 

¿Se puede afirmar que la de Colombia es la primera comisión de la verdad nativa digital del mundo?

Usualmente las comisiones de la verdad tienen problemas de tiempo y ese es un gran inconveniente con el que han tenido que lidiar porque, en síntesis, tienen unas misionalidades muy ambiciosas y poco tiempo para cumplirlas. El caso colombiano no es ajeno a esa situación. A su vez, tenemos el gran desafió de que la Comisión de la Verdad de Colombia sucede en el marco de un conflicto de larga duración que ha sido ampliamente documentado por diversas instituciones y ejercicios analíticos, por ejemplo, tenemos el legado del Centro Nacional de Memoria Histórica, la producción analítica de las universidades acerca del conflicto armado, las publicaciones de los medios de comunicación y las investigaciones de las organizaciones de derechos humanos y ONG´s. Contamos pues con una cantidad increíble de insumos y, dado que hablamos de una comisión que busca la pluralidad, debemos atender a todos esos insumos e incorporarlos en nuestro ejercicio reflexivo.

En este sentido, nos hemos visto enfrentados a una cantidad excepcionalmente amplia de información que debemos procesar, clasificar y documentar muy rápido para su aprovechamiento. A esto se suma que tenemos unas expectativas importantes respecto a la labor de escucha. Nos planteamos una meta de 12 mil entrevistas realizadas a personas que tuvieron alguna participación en el conflicto, y son entrevistas que en promedio duran una hora y cuarenta minutos, y esto supone también un desafío. Sumamos a eso una cantidad importante de documentos e informes de la sociedad civil que han sido leídos, entendidos y procesados; y una serie de bases de datos y de información estructurada de diversas fuentes. Hoy tenemos alrededor de 350 bases de datos que le brindan contexto a la investigación.

Lo que hicimos fue que nos valimos de recursos tecnológicos disponibles para el procesamiento de toda esta información. Y en este proceso no tuvimos un referente en el cual apoyarnos, ya que las comisiones que habían existido en el mundo fueron casi por completo análogas. No existía una metodología para el manejo de macrodatos en comisiones de la verdad. Por eso, en su momento nos preguntamos: ¿Cómo vamos a elaborar una comisión de la verdad cuando no hay hoy un software para comisiones?

La cuestión también pasaba por el discurso de que la comisión debía ser autónoma, transparente y neutral, y en ese sentido la mejor apuesta fue desarrollar nuestros propios instrumentos sin depender de un tercero ni de la compra de un software, y lo hicimos con una desventaja gigantesca, y es que contamos con un tiempo muy breve. Aún así fuimos elaborando una solución a la medida. Adicional a ello, pensamos que nuestra herramienta digital debía quedar abierta y disponible para próximos ejercicios similares a una comisión. De manera que la apuesta fue irnos por lo digital, manejar macrodatos, ciencia de datos, humanidades digitales e inteligencia artificial, para conservar esta memoria. Y si no hubiéramos optado por hacer que la comisión fuera nativa digital, la pandemia no nos hubiera permitido avanzar con la rapidez con la que desarrollamos hoy nuestro trabajo.

¿Cómo funciona el software que ustedes han ido armando a la medida?

Tras analizar las diversas fuentes de información que nosotros íbamos a tener que administrar y procesar, decidimos crear nuestra propia herramienta para tratar entrevistas, documentos, informes, investigaciones, archivos, base de datos e información estructurada. Para ello necesitábamos adoptar e implementar una herramienta a la medida que nos permitiera dar un salto. El módulo encargado de las entrevistas, por ejemplo, fue desarrollado a la medida, mientras que todas las demás herramientas se basaron en herramientas libres que fueron adaptadas a nuestras necesidades. Así que, entre otras cosas, tomamos un software de datos abiertos para administrar nuestra información estructurada. Utilizamos otro software para la información documental y luego la migramos a nuestro propio sistema. Articulamos otras herramientas, una para la transcripción, otra para el etiquetado, etc. Y con todo eso fuimos construyendo un ecosistema de herramientas. Nuestra base de datos está conectada a un sistema que permite replicar un modelo de buscador, una especie de Google. A todo le agregamos medidas de catalogación, un tesauro, unas herramientas de clasificación y de lingüística que nos han permitido catalogar y describir de manera sistemática la información. Lo cierto es que estamos aprovechando muchas herramientas que están libres, con el fin de adecuarlas e integrarlas a nuestras necesidades para ofrecer al final un resultado que nos permita conocer qué pasó en el país durante el conflicto armado.

¿Cuáles son las ventajas y desventajas de que la comisión sea nativa digital?

Yo veo sobre todo ventajas. Soy un creyente de los aportes que pueden ofrecer las tecnologías. Las ventajas que nos facilitan en el procesamiento de las entrevistas, por ejemplo, son enormes. Primero hay que decir que hemos contado con un excelente equipo de transcriptores que han escuchado más de ocho mil entrevistas de las 12 mil que hizo la comisión a toda clase de actores. Y hoy esos textos hacen parte de un sistema con un árbol de decodificación que tiene alrededor de 300 términos. Esto facilita mucho la búsqueda, la recuperación, la contrastación, la accesibilidad y usabilidad de esa información a través de un programa que hemos adaptado. Yo ya puedo poner en un buscador con el que contamos palabras claves para saber qué pasó en tal región en tal tiempo. Hago la búsqueda, como si fuera un Google, y traigo la documentación que me narra lo que busco, aludiendo a la periodicidad o al hecho o victimización, esto gracias a filtros. En síntesis, con la tecnología podemos ser más plurales y equitativos. Es tener la garantía de que las personas que nos entregaron su voz y confianza realmente podrán ser escuchadas.

Ahora, esa información preprocesada en un software nos permite realizar unos procesamientos adicionales, como el desarrollo de análisis de lenguaje natural que permiten hacer un examen del discurso de manera automatizada para encontrar algunas claves en el uso del lenguaje y en los términos que se están incorporando en las narrativas.

Por otra parte, están los análisis estadísticos de datos estructurados para contrastar fuentes. Aquí se juntan todas las posibilidades que tenemos de la ciencia de datos. Toda la facilidad que nos ofrece el procesamiento de grandes volúmenes de información que sería imposible con los métodos análogos convencionales.

Hay que aclarar que los soportes no se perderán. Por ejemplo, los audios de las entrevistas con su riqueza en tonalidad y entorno seguirán estando disponibles y hay un equipo en la comisión trabajando sobre eso. Por eso nos estamos esforzando para que exista al final la disponibilidad de la mayor cantidad de información de archivo posible. Y es que nuestra apuesta es llegarle a la gente. En ese sentido estamos mirando todas las alternativas que tenemos disponibles para el repositorio, la transmedia y todo nuestro acervo digital para que pueda ser consultado por la ciudadanía.

Ahora, esto tiene unos desafíos muy grandes en los que ahora estamos trabajando. Lo que más nos preocupa es que existe una brecha digital, de alfabetización digital en el país. ¿Cómo llegar a los usuarios que poco saben de tecnología y que usualmente no están conectados a internet, que no son usuarios nativos digitales? Partiendo de allí estamos buscando mediaciones, y esto es una apuesta por la replicación, la apropiación y la descentralización del acervo. Estamos explorando opciones.

Algo más que estamos pensando es cómo hacer que la información sea accesible desde los celulares, por lo que ya tenemos en mente un diseño móvil. Hay retos y creo que vamos a dejar un legado bien bonito a las siguientes generaciones y ejercicios de verdad.

También hay una apuesta muy grande de esta comisión y es hacer lo posible porque no quede cerrada, como ha sucedido con otras comisiones. Y para eso estamos haciendo todo lo posible por resguardar la privacidad e identidad de los donantes de información. Por eso creemos que brindarle al público herramientas y metodologías para el uso de la información que entregaremos es una alternativa que potenciará la apuesta de esta comisión.

El trabajo de la Comisión está enmarcado en una metodología de Humanidades Digitales ¿El lenguaje computacional no deteriora de algún modo la apuesta humanista de la Comisión?

Esos son dilemas tradicionales con empaques nuevos. Las preguntas sobre lo ético siempre están vigentes. La cuestión creo que sería cómo dar un trato ético a la información. Y esta pregunta está por encima o trasciende el hecho de que la información sea digital o no. ¿Cómo podemos respetar lo humano, lo sensible, lo vivencial en el terreno digital?, ¿Cómo podemos hacer un uso metódico, riguroso y transparente de la información digital? Todos esos asuntos nos los hemos formulado en la construcción de este legado.

Entonces, ¿qué tan trasparente puede llegar a ser la comisión para que cualquier persona pueda analizar los procesos metodológicos que dieron cuenta de los resultados que se van a publicar? Nosotros estamos documentando el software, así como los análisis cuantitativos con una sistematización juiciosa de cómo fueron las apuestas metodológicas que se realizaron dentro de cada uno de los equipos de la comisión. Y en ese sentido buscamos ser no una caja negra sino una caja abierta que permita ser escudriñada y auditada abiertamente por cualquier ciudadano. De esa transparencia se desprende otra responsabilidad y es: si somos transparentes realmente tenemos que revelar el manejo ético de cada uno de los procesos que se han dado en el interior. Y aquí es importante que se pueda mirar cómo hemos tomado información de manera plural y escuchado todas las veces que han deseado participar y cómo las hemos documentado sin distinción alguna.

¿En qué nivel va el trabajo del equipo que lidera?

El sistema de información fue planeado con tres grandes momentos, uno para cada año de la Comisión. El primer año se empleó en la creación del sistema mismo, la solución tecnológica que nos ha permitido recolectar, administrar, clasificar y proteger toda la información que ha estado manejando la comisión para alimentar sus procesos misionales. El segundo se invirtió en el preprocesamiento y procesamiento de la información, fortaleciendo trabajos de transcripción y codificación de entrevistas y la recolección de base de datos. En este universo hemos tenido el acompañamiento de expertos en ciencias de datos con quienes hemos tenido una conversación muy fluida respecto de las metodologías analíticas a utilizar. Todo esto para enriquecer el trabajo del informe final y para acompañar las tareas de diálogo social.

Y este año, es decir, la tercera etapa, está dirigida a la entregada del legado de la Comisión, su informe final, una sistematización de todo el proceso, un ejercicio transmedia que nos va a permitir ver en narrativa digital los resultados del informe final, además de un repositorio museo que nos va a permitir navegar por la información y las discusiones planteadas.

 


A propósito de la entrevista a Andrés Medina les invitamos a ver la grabación de la conversación Memorias futuras: el archivo de la Comisión de la Verdad, que se realizó el 19 de mayo.