Redes bayesianas para prevenir la deserción escolar: Una solución basada en datos.
- 212310246
- 16 feb
- 4 Min. de lectura
Actualizado: 18 feb

Dra. Karla Verónica Rodríguez Lozano
Dr. Antonio Mendoza Ruelas
Tecnológico Nacional de México - Instituto Tecnológico Superior de Lerdo
La deserción escolar representa uno de los mayores desafíos para las instituciones educativas, donde se estima que solo uno de cada tres jóvenes que inicia una carrera universitaria la concluye. Este problema se agrava en carreras relacionadas con las tecnologías, donde factores como la curricular obsoleta, la falta de hábitos de estudio o la escasa participación en plataformas virtuales afectan de manera significativa la permanencia estudiantil.
Pero ¿y si pudiéramos anticipar el abandono? ¿Y si existiera una forma de detectar, antes de que ocurra, quién está en riesgo de desertar?
En este contexto, surge una propuesta: un modelo predictivo basado en redes bayesianas, capaz de estimar el riesgo de deserción escolar utilizando variables académicas y digitales. Este modelo ha sido diseñado específicamente para la carrera de Ingeniería en Sistemas Computacionales del Instituto Tecnológico Superior de Lerdo (ITSL), con el objetivo de generar alertas oportunas y orientar la intervención institucional.
Conceptos clave
Big Data se refiere a la capacidad de procesar grandes volúmenes de datos, generados a alta velocidad y con gran variedad. Para este proyecto, esta información abarca calificaciones, asistencia, entrega de tareas y la interacción con plataformas virtuales como Moodle (plataforma de aprendizaje en línea).
Una red bayesiana es un modelo matemático probabilístico que representa las relaciones de causa y efecto entre variables. A diferencia de otras técnicas de inteligencia artificial, destaca por su transparencia e interpretabilidad, lo que facilita su adopción en contextos educativos (Larrañaga et al., 2021).
En este caso, el modelo vincula variables como “no entrega de tareas”, “baja interacción” o “escasa conectividad” con la probabilidad de abandono. Esto permite que el personal académico no solo reciba una alerta, sino que entienda el porqué de esa predicción.
En este proyecto, esos datos son organizados, depurados y analizados mediante un modelo de inteligencia artificial conocido como red bayesiana, que ayuda a identificar estudiantes en riesgo de abandono escolar. Este modelo permite que la institución actúe con anticipación y diseñe intervenciones más acertadas, basadas en evidencia y no en suposiciones.
¿Cómo se construyó el modelo?
El desarrollo del modelo siguió la metodología llamada Proceso Estándar para la Minería de Datos entre Industrias “CRISP-DM” (Cross Industry Standard Process for Data Mining), que consta de seis fases, las cuales se explican a continuación y se resumen dentro de la figura 1. Este enfoque combina técnicas de Big Data, estadística bayesiana y visualización educativa para apoyar la toma de decisiones basadas en evidencia.
1. Comprensión del contexto educativo y la problemática específica de deserción en el ITSL.
2. Recolección de datos a partir de registros de calificaciones, asistencia, participación, entregas, etc.
3. Preparación de los datos convirtiendo las variables a formatos compatibles con el modelo.
4. Diseño y entrenamiento de la red bayesiana con Python y pgmpy, seleccionando las relaciones más significativas.
5. Validación del modelo con datos reales, alcanzando una precisión esperada superior al 80%.
6. Visualización e implementación en forma de dashboard de alertas.ogía CRISP-DM

¿Qué variables influyen más?
De acuerdo con el análisis realizado, tres grupos de variables resultaron especialmente relevantes:
Académicas: calificaciones parciales, asistencia, reprobación de materias.
Digitales: número de accesos a Moodle, entregas de tareas, participación en foros.
Contextuales: historial de tutoría, datos de ingreso, rendimiento previo.
Una de las aplicaciones más valiosas del modelo es su integración en un sistema de alerta temprana, el cual clasifica automáticamente a los estudiantes según su nivel de riesgo de deserción (bajo, medio o alto). A partir de esta clasificación, el sistema genera recomendaciones personalizadas para que docentes, tutores o responsables académicos puedan intervenir de forma oportuna. En la figura 2, se muestra la gráfica de resultados del modelo predictivo, donde los estudiantes son clasificados automáticamente en tres niveles de riesgo: bajo, medio y alto. La mayoría se concentra en el nivel bajo (120 estudiantes), seguido por el medio (80) y finalmente el alto (30), lo que permite a la institución priorizar intervenciones y focalizar esfuerzos en quienes más lo necesitan. Esta clasificación es clave para la toma de decisiones oportunas y personalizadas por parte del personal académico.
Figura 2. Distribución de estudiantes por nivel de riesgo

Los análisis realizados revelaron que las variables digitales, como la entrega de tareas o la participación en plataformas virtuales, poseen un mayor poder predictivo que las variables académicas tradicionales, una tendencia que también ha sido validada en modelos basados en redes neuronales artificiales (Jiménez-Gutiérrez et al., 2024). Esto permite pasar de un enfoque reactivo a uno proactivo: en lugar de esperar hasta el final del semestre, las instituciones pueden anticiparse, brindar apoyo individualizado y fortalecer el acompañamiento académico desde etapas tempranas. Además, el sistema ha sido diseñado con una estructura modular que permite su adaptación a diferentes carreras y contextos institucionales, lo que lo convierte en una herramienta versátil, escalable y alineada con los principios de mejora continua en la educación superior.
El uso de modelos predictivos como las redes bayesianas marca un antes y un después en la forma en que las instituciones educativas pueden abordar la deserción escolar. Este proyecto no solo aporta una solución tecnológica, sino que también plantea una visión más humana y estratégica de la educación: una donde los datos no son solo números, sino herramientas para comprender, prevenir y acompañar.
Referencias
Amaya-Amaya, A., Huerta-Castro, F., & Flores-Rodríguez, C. O. (2020). Big Data, una estrategia para evitar la deserción escolar en las IES. Revista Iberoamericana de Educación Superior, (31), 166–178. https://doi.org/10.22201/iisue.20072872e.2020.31.712
Jiménez-Gutiérrez, A. L., Mota-Hernández, C. I., Mezura-Montes, E., & Alvarado-Corona, R. (2024). Application of machine learning techniques in predicting school dropout. Scientific Reports, 14(3957). https://doi.org/10.1038/s41598-024-53576-1
Larrañaga, P., Armañanzas, R., Bielza, C., et al. (2021). Interpretable artificial intelligence for classification and decision making using Bayesian networks: Application to educational data. AI Communications, 34(3), 265–280. https://doi.org/10.3233/AIC-210065
Olarte Sancán, Y. J., Cruz Felipe, M. R., Pinargote Ortega, J. M., & Mejía Almenaba, J. A. (2023). Predicción del rendimiento académico de estudiantes universitarios en la plataforma Moodle mediante Big Data. Serie Científica, 16(9), 61–77.
Sosa-Alonso, J. J., López-Aguilar, D., Álvarez-Pérez, P. R., & González-Morales, O. (2025). Predicting university dropout: Connecting big data and structural models. Studies in Higher Education, 1–18. https://doi.org/10.1080/03075079.2025.2462675


Comentarios