El Modelo Perfecto, El Dato Injusto: El Colapso de un Proyecto de Analítica en Branwen Parvis

En el Colegio Branwen Parvis de Artes y Letras, nuestra tesis fundacional del “Artesano Digital” exige que nuestros estudiantes nunca separen la herramienta técnica (el cómo) de su implicación humanística (el porqué). No es una filosofía abstracta; es una metodología activa y, a menudo, incómoda. Este mes, esta metodología ha sido puesta a prueba hasta su punto de ruptura en uno de los proyectos más ambiciosos y reveladores de nuestro año académico.

El proyecto fue una colisión deliberada, diseñada por la dirección académica. Enfrentó a dos de nuestros programas de Máster más potentes: el MSc in Business Analytics & FinTech y el MA in Comunicación Estratégica y Humanidades Digitales.

A los estudiantes de Business Analytics, bajo la tutela de nuestro claustro cuantitativo, se les entregó un tesoro: un conjunto de datos (dataset) real, masivo y anonimizado de un socio industrial (un importante retailer). El objetivo era un ejercicio clásico de ciencia de datos: “Construir un modelo de machine learning para identificar a los empleados de ‘alto potencial’ (HiPo) y optimizar el pipeline de ascensos”. Era un desafío técnico de primer nivel.

El equipo de analítica hizo exactamente lo que se esperaba de ellos, y lo hizo brillantemente. Aplicaron un ensemble de modelos (desde Random Forests hasta Gradient Boosting), realizaron una ingeniería de características (feature engineering) impecable y, tras semanas de trabajo, presentaron un modelo predictivo con una precisión (accuracy) del 92%. Un triunfo técnico.

Pero en Branwen Parvis, cada proyecto técnico tiene un auditor.

Simultáneamente, el mismo dataset fue entregado a los estudiantes del MA de Humanidades Digitales, dirigidos por la Dra. Sofía Herrero (Catedrática de Semiótica). Su tarea no era construir un modelo. Su tarea era realizar una “autopsia de los datos” (Data Forensics). No miraron los números; miraron las palabras.

Mientras los analistas optimizaban la precisión, los humanistas analizaban los archivos de texto que se habían usado para crear esas etiquetas de “alto potencial”: quince años de evaluaciones de desempeño (performance reviews) escritas por gerentes.

Lo que descubrieron detuvo el proyecto en seco.

El equipo de la Dra. Herrero presentó sus hallazgos una semana antes de la defensa final de los analistas. Mediante un análisis de discurso computacional (NLP aplicado a la semiótica), demostraron un sesgo estructural devastador y sistémico en el lenguaje de origen.

Descubrieron que los empleados masculinos que eran ascendidos eran descritos con verbos de acción y agencia: “lidera”, “ejecuta”, “desafía”, “visión estratégica”. En cambio, las empleadas femeninas con evaluaciones igualmente positivas eran descritas con verbos de estado y colaboración: “organizada”, “apoya”, “colabora”, “trabaja duro”, “buena actitud”.

El problema era demoledor: la etiqueta “alto potencial” estaba, en sí misma, semánticamente corrupta.

El “modelo perfecto” con un 92% de precisión del equipo de Business Analytics no estaba prediciendo el “potencial futuro”. Estaba prediciendo, con una eficiencia del 92%, la probabilidad de que un empleado fuera descrito con “lenguaje de liderazgo” masculino. El modelo no era una herramienta de descubrimiento; era un motor de blanqueo de sesgos históricos. Era una máquina de perpetuar el pasado.

La presentación conjunta de ambos Másteres, normalmente un evento de celebración, fue, debemos admitirlo, una de las sesiones más tensas y difíciles del año. Los estudiantes de analítica estaban, comprensiblemente, frustrados. Su matemáticas eran correctas. Su modelo funcionaba según los parámetros técnicos.

“Nuestro modelo es preciso”, argumentó uno de los estudiantes de MSc. “No es culpa nuestra que los datos de la empresa estén sesgados”.

La respuesta de la Dra. Herrero, en nombre de la filosofía de la institución, fue la lección central: “Como analista, si tratas un dataset como una verdad matemática y no como un artefacto cultural, has fallado. El dato no es el punto de partida; es el primer punto de auditoría. Vuestro modelo no es ‘preciso’; es simplemente un espejo perfecto de una injusticia histórica”.

En el Colegio Branwen Parvis de Artes y Letras, este proyecto no fue calificado como un fracaso. Fue calificado como nuestro éxito pedagógico más importante del año. Ha demostrado, sin lugar a dudas, que no se puede ser un “Artesano Digital” si se es solo un técnico.

Como resultado directo, la Rectora Shelby Prièste ha anunciado la creación de un nuevo módulo obligatorio para todos los programas de MSc y MA: “Auditoría Societal y Forense de Datos”. Porque la precisión sin contexto no es inteligencia; es solo un eco.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *