Experiencia, rigor técnico y metodología: por qué el INE designó a Signa Lab para filtrar las preguntas ciudadanas del primer debate

Por: Siboney Flores
Para: Animal Político

Para que Signa Lab del Instituto Tecnológico y de Estudios Superiores de Occidente (ITESO) fuera designada como la organización encargada de  filtrar y seleccionar las preguntas que enviará el público para el primer debate presidencial, se realizó un procedimiento de asignación por parte de los consejeros electorales que implicó la invitación y envío de descripción metodológica a cinco instituciones por su buen trabajo en el área,  la recepción de sus respuestas metodológicas, entrevistas con los equipos y votación por mayoría.

El papel de Signa Lab será filtrar las miles de preguntas que enviará la ciudadanía al INE a través de redes sociales para el primero de tres debates previstos en las campañas presidenciales de 2024, el cual se llevará a cabo el 7 de abril. Según informó el INE, cualquier persona mayor de 13 años podrá enviar preguntas y el plazo de recepción de las mismas comenzará a las 07:00 horas del 20 de febrero y concluirá a las 23:59 horas del 21 de marzo.

El ITESO no fue la única institución invitada a participar para obtener la asignación. El Consejo General del Instituto Nacional Electoral (INE) invitó a su convocatoria a otras cuatro instituciones: la Universidad Autónoma de Puebla, el Centro de Investigación en Ciencias de Información Geoespacial, el doctor Carlos Adolfo Piña García como propuesta independiente y el Observatorio de Medios de la Facultad de Estudios Superiores de la UNAM plantel Aragón.

A todas las instituciones descritas se les envió un documento con la metodología requerida para hacer posible el ejercicio electoral y se esperó de vuelta una propuesta metodológica. En la respuesta, las organizaciones también incluían propuestas de visualización y explicaban sus mecanismos, las tecnologías empleados y la cantidad de personal operativo.

Las respuestas de estas instituciones se debatieron entre los consejeros electorales en la comisión de debates del pasado 6 de febrero y en la sesión extraordinaria del 8 de febrero se concluyó por unanimidad otorgarle la asignación.

La metodología requerida por el INE para este ejercicio electoral está descrita en el acuerdo del Consejo General del INE membretado como CG95/2024. Aquí puedes consultarlo tú mismo.

En ella se explica que la institución asignada debe de preparar la base de datos, obtener una estratificada y clasificación por tres regiones del país, seleccionar preguntas, revisar preguntas. Todo en plazos establecidos y con un máximo de tres días después del debate presidencial se deberá presentar un informe detallado.

Además, este no es el primer ejercicio similar en el que trabaja Signa Lab. Durante las elecciones presidenciales de 2018, cuando Andrés Manuel López Obrador era candidato, el INE también invitó a la institución a realizar un ejercicio similar. Su informe de actividades y resultados de ese ejercicio electoral lo puedes consultar aquí. 

Exactamente, ¿qué hará Signa Lab? 

El laboratorio de innovación de Signa Lab no realizará las preguntas, ni tendrá forma de editarlas o proponerlas, como hace suponer las críticas por su designación de parte de Morena y su candidata presidencial, Claudia Sheinbaum, quienes aseguran que “de antemano ya estén cargando la balanza para un lado” y que el pasado lunes 12 de febrero realizaron una impugnación para buscar cancelar dicha designación.

Rossana Reguillo,  coordinadora general de Signa Lab del ITESO, dijo que “no hay manera de que yo, personalmente, vaya a torcer las preguntas o vaya a poner unas que no son”, durante una entrevista en W Radio. La académica hace referencia a la serie de requerimientos técnicos que son solicitados por el INE para cumplir con la propuesta.

Te explicamos paso a paso: 

Preparación de la base de datos 

Esto significa que Signa Lab recibe de parte de la Comisión Nacional de Comunicación Social del INE toda una base de datos con el total de preguntas realizadas por la ciudadanía, a través de redes sociales y otras plataformas de internet. Por esta recepción debe firmar y comprometerse al principio de confidencialidad.

Obtención de la muestra y clasificación por regiones 

De todas las preguntas realizadas por la ciudadanía, debe clasificarlas por tema preguntado: educación y salud; transparencia y combate a la corrupción; y la no discriminación, grupos vulnerables y violencia contra las mujeres. El resto de temas preguntados deberán ser descartados.

Esa misma selección de preguntas debe de clasificarse según la zona geográfica en la que fue realizada, puede ser norte, centro o sur del país.

Selección de preguntas

Debe revisar que los temas preguntados sean acordes a los temas del primer debate, definidos desde diciembre, y no pueden incluir discursos de odio, inclinación apartidista, ideologia religiosa, cualquier muestra de violencia o discriminación, y las preguntas deber ser generales, no pueden ser dirigidos a un candidato en especial.

Revisión de preguntas

Debe de seleccionar 108 preguntas bajo los principios de “frecuencia y aleatoriedad” y deben volver a realizar una revisión. Estas preguntas deben de ser de uno de los tres temas asignados para el debate, se entiendan, sea posible plantearse a cualquier candidato, sin sesgo partidista, no contengan palabras ofensivas y expresiones en doble sentido.

Plazos establecidos e Informe 

Las 108 preguntas seleccionadas bajo los principios de “frecuencia y aleatoriedad” deben ser entregadas al INE para que a su vez las comparta con el moderador o moderadora del primer debate presidencial y decida qué preguntas emplear durante el ejercicio electoral.

A más tardar, a los tres días del debate presidencial, Signa Lab debe de entregar un reporte a la coordinación nacional de Comunicación Social del INE que muestre el paso a paso que permite replicar el procedimiento realizado y llegue a las mismas conclusiones. Este informe debe incluir bitácoras, descripciones de cada etapa desarrollada para cumplir la metodología. También debe entregar la base de datos con todas las preguntas almacenadas y las bases restantes de cada uno de los procedimientos realizados.

 

La propuesta enviada por Signa Lab para 2024 

Dentro del procedimiento de convocatoria, Rossana Reguillo,  coordinadora general de Signa Lab del ITESO, respondió con una propuesta metodológica a Elia Baltazar, directora de comunicación y análisis informativo tras la invitación a la convocatoria. La puedes ver aquí. 

En el documento se explica qué herramientas digitales y metodológicas planean utilizar para definir las 108 preguntas a entregar.

El primer paso propuesto es a través de algoritmos que detectan el lenguaje natural en las conversaciones, se van a identificar cuáles son las preguntas más frecuentes, y sus similitudes y diferencias entre ellas.

Luego propone utilizar árboles semánticos, mapas de relaciones semánticas o embeddings, para identificar y agrupar los temas comunes preguntados. Como salud y educación, transparencia y corrupción, por mencionar algunas.

Después propone sistematizar y elaborar “una selección muestral estratificada de preguntas” para que se cumpla con lo requerido por el INE, como que las preguntas sean sobre los temas del debate presidencial y se realicen desde diferentes zonas del país.

Finalmente, revisar con el Procesamiento de Lenguaje Natural (PLN) y una revisión manual las 108 preguntas seleccionadas para ver que cumplan con los criterios requeridos por el INE y en caso de necesitar, sustituir alguna.

Incluso hace una propuesta adicional sobre hacer visualizaciones de nubes y árboles semánticos sobre los comentarios realizados en redes sociales por la ciudadanía y los titulares empleados en noticiarios tras el ejercicio electoral.

El informe presentado en 2018 

En 2018 Signa Lab presentó el informe de sus actividades realizadas. Explicó que entre el 31 de mayo y el 5 de junio, almacenaron un total de 11 mil 538 tuits que respondían al ejercicio electoral y cuestionaban sobre siete temas a los candidatos a la presidencia.

Explicaron que para obtener el total de tuits realizaron una “minería de datos” con diferentes herramientas que les permitieron evaluar la conversación alrededor del hashtag #DebateINE, esto implicaba tres diferentes análisis: la interacción entre usuario a usuario, usuario frente al hashtag, y este hashtag frente a otros hashtags.

Luego utilizaron una herramienta de visualización para mostrar los candidatos más cuestionados y los temas más cuestionados.

Entre sus conclusiones encontraron que los tres candidatos con mejor preferencia en las encuestas eran los más cuestionados, se trata de Ricardo Anaya, López Obrador y José Meade.  Del total de preguntas realizadas, los temas más cuestionados a través de redes sociales fueron educación con 25.40% y salud con 20.55%. El resto de sus conclusiones puedes leerlas en su informe de actividades.