Resumen
La deserción estudiantil universitaria representa un desafío crítico para las instituciones de educación superior en diversos países, particularmente en regiones con limitaciones estructurales comúnmente localizadas en zonas rurales. Este fenómeno, que compromete la equidad, eficiencia y la calidad educativa en ecosistemas universitarios, nos motiva a la búsqueda de soluciones basadas en tecnologías emergentes. En respuesta a esta problemática, la presente tesis doctoral propone un modelo predictivo de deserción estudiantil fundamentado en la Explainable Artificial Intelligence (XAI, por sus siglas en inglés), conocida en español como Inteligencia Artificial Explicable, orientado a la toma de decisiones informadas basada en datos, con la finalidad de plantear estrategias preventivas para mejorar la retención estudiantil en el ámbito universitario.
El estudio integra enfoques metodológicos del proceso Cross Industry Standard Process for Data Mining (CRISP-DM, por sus siglas), referenciado en español como Proceso Estándar Intersectorial para la Minería de Datos, y la Metodología del Marco Lógico (MML), lo que permite una articulación entre el análisis técnico de datos y la formulación de estrategias institucionales. El conjunto de datos empleado se sustenta a partir de registros holísticos de estudiantes de la escuela de Ingeniería de Minas, de la Universidad Nacional de Moquegua (UNAM), necesario para el desarrollo de un modelo optimizado mediante técnicas de balanceo, específicamente la herramienta Synthetic Minority Oversampling Technique (SMOTE, por sus siglas en inglés), conocida como Técnica de Sobre-muestreo Sintético de la Minoría, y el uso de técnicas de XAI, como la herramienta de valores SHAP (SHapley Additive exPlanations, en adelante SHAP), una técnica de Explicaciones Aditivas de Shapley para identificar la influencia de cada variable o factores clave asociados a la deserción como, por ejemplo, la sede de estudios y la modalidad de ingreso a la universidad.
Junto con la construcción del modelo y el análisis predictivo mediante Inteligencia Artificial (IA), se proponen protocolos de acción basados en hallazgos explicables derivados del propio modelo. También una arquitectura para una futura plataforma tecnológica que incorpore visualizaciones interactivas, alertas tempranas y recomendaciones automatizadas. Estas contribuciones apuntan a institucionar el uso de analítica educativa como herramienta de gestión académica en el ámbito universitario, planteamientos para futuras líneas de investigación.
Los resultados obtenidos evidencian el potencial de la XAI para abordar problemas complejos en el ámbito de la educación universitaria, ofreciendo una contribución significativa al diseño de estrategias preventivas y adaptativas de intervención, con posibilidades de replicabilidad en otros contextos nacionales e internacionales.
Palabras clave
Deserción estudiantil; Inteligencia Artificial; IA; Inteligencia Artificial Explicable; XAI; Retención universitaria; Aprendizaje automático; SHAP; SMOTE; CRISP-DM; Modelo predictivo; Modelo preventivo; Educación superior; Minería de datos; Intervención educativa; Alineamiento constructivo; Plataforma de recomendación.