1
Datos
Capa de captura de datos reales
Fuentes de datos del sistema educativo real: matrículas, trayectorias, evaluaciones, asistencia, indicadores socioeconómicos, inversión, infraestructura. Es el "sensor" del gemelo — sin esta capa no hay gemelo, solo simulación.
LMS / Moodle SINIDE / SIGAE Encuestas nacionales Censos educativos APIs abiertas
2
Modelo
Capa de representación del sistema
Modelo computacional que representa el estado actual del sistema educativo. Incluye relaciones causales entre variables: ¿cómo afecta la infraestructura al rendimiento? ¿qué variables predicen el abandono? Aquí vive el modelo predictivo calibrado con datos históricos reales.
ML supervisado Modelos de supervivencia Redes causales Análisis de redes
3
Generativa
Capa generativa — simulación de escenarios
Lo que distingue al gemelo generativo del gemelo digital clásico. Usa IA generativa para producir escenarios hipotéticos no observados: "¿qué pasaría si aumentamos la inversión en formación docente en las provincias con mayor abandono?" El modelo genera futuros posibles antes de actuar.
LLMs para síntesis GANs para datos sintéticos Simulación ABM Monte Carlo
4
Decisión
Capa de apoyo a decisiones de política
Interfaz entre el modelo y los tomadores de decisiones. Traduce los escenarios generados en recomendaciones comprensibles, con rangos de incertidumbre explícitos. El modelo no decide — informa. El responsable político sigue siendo humano. Esta capa incluye mecanismos de auditoría y trazabilidad.
Dashboards Rangos de confianza Explicabilidad (XAI) Auditoría algorítmica
5
Retroalimentación
Capa de retroalimentación y corrección
El ciclo que cierra el gemelo: las decisiones tomadas en la capa 4 modifican el sistema real, que genera nuevos datos en la capa 1. El modelo se recalibra con los resultados reales. Sin esta capa el gemelo envejece y se desconecta de la realidad — es el riesgo del model collapse.
Actualización continua Detección de drift Evaluación de impacto Reentrenamiento
Tensiones constitutivas del modelo
Estas tensiones no tienen solución — son inherentes al uso de modelos para informar política pública. Reconocerlas es parte de la alfabetización en IA que propone esta materia.
Precisión del modelo
vs
Comprensibilidad
Los modelos más precisos (deep learning) son los más opacos. Los más comprensibles (regresión logística) son los menos precisos. ¿A quién le explicás el modelo — al técnico o al ministro?
Datos históricos
vs
Cambio social
El modelo aprende del pasado para predecir el futuro. Pero en sistemas sociales el pasado está cargado de inequidades que el modelo puede reproducir y amplificar con apariencia de objetividad.
Escala nacional
vs
Contexto local
Lo que predice el modelo para el promedio nacional puede ser completamente erróneo para una escuela rural en Jujuy o un barrio periférico en el Gran Buenos Aires.
Simulación de futuros
vs
Efectos no modelizados
Toda política educativa genera efectos que el modelo no anticipó. El riesgo es confundir "el modelo no lo predijo" con "no va a ocurrir". La ausencia en el modelo no es ausencia en la realidad.
Decisión informada
vs
Delegación volitiva
El gemelo debería informar decisiones humanas, no reemplazarlas. Pero cuando el modelo es complejo y opaco, "lo dijo el algoritmo" se convierte en escudo político contra la rendición de cuentas.
Datos abiertos
vs
Privacidad
Un gemelo más preciso necesita más datos individuales de estudiantes. Pero esos datos son sensibles. ¿Quién los controla? ¿Quién puede auditarlos? ¿Con qué consentimiento se recolectaron?
¿Los sistemas de alerta temprana son gemelos generativos?
Los sistemas de alerta temprana para abandono escolar implementan las capas 1 y 2 del metamodelo, pero se detienen ahí. Les falta la capa generativa (3) — no simulan escenarios hipotéticos de intervención — y frecuentemente carecen de la capa de retroalimentación (5). Son gemelos digitales parciales, no gemelos generativos.
Lo que tienen ✓
Datos reales de trayectorias
Modelo predictivo de riesgo
Alertas automáticas
Algunos tienen dashboard
Lo que les falta ✗
Simulación de intervenciones
Escenarios hipotéticos
Retroalimentación con resultados
Auditoría algorítmica pública
El paso siguiente →
"¿Qué intervención reduce más el abandono para este perfil?"
"¿Cuánto cuesta vs. cuántos estudiantes retiene?"
"¿La intervención funcionó? Recalibrar."
Eso sería un gemelo generativo.
Preguntas para el aula
Diseñadas para formadores de política y docentes. No tienen respuesta única.
1
La pregunta de Box ¿Qué simplificaciones hace este modelo del sistema educativo? ¿Qué queda afuera? ¿Es útil a pesar de eso?
2
La pregunta de la delegación volitiva Si el modelo recomienda cerrar escuelas rurales porque "son ineficientes", ¿quién es responsable de esa decisión?
3
La pregunta del overfitting ¿El modelo aprendió patrones generalizables o memorizó las particularidades del período en que fue entrenado?
4
La pregunta del model collapse Si el gobierno usa el gemelo para tomar decisiones que cambian el sistema, y luego reentrenan el modelo con los nuevos datos, ¿el modelo puede volverse circular?
5
La pregunta de Funes Un gemelo con datos perfectos de cada estudiante, ¿puede abstraer patrones útiles o colapsa en una base de datos gigante sin capacidad de generalizar?
6
La pregunta de Slezak ¿Cuándo un anuncio de "gemelo digital educativo" es tecnología real y cuándo es laundering de decisiones políticas ya tomadas?