Buscar


Mostrar el registro sencillo del ítem

dc.rights.license https://creativecommons.org/licenses/by-nc-nd/4.0 es_ES
dc.contributor Jose Fernando Vasco Leal es_ES
dc.creator Javier Sosa Franco es_ES
dc.date.accessioned 2026-01-12T18:01:14Z
dc.date.available 2026-01-12T18:01:14Z
dc.date.issued 2025-11-04
dc.identifier.uri https://ri-ng.uaq.mx/handle/123456789/12443
dc.description La presente investigación tiene como objetivo proponer un modelo predictivo fundamentado en la ciencia de datos y la inteligencia artificial, que permita identificar de manera anticipada estudiantes que estén en riesgo de reprobar tercer grado de secundaria general en el estado de Querétaro. Esta problemática educativa se aborda desde una perspectiva analítica, considerando que la reprobación escolar impacta negativamente otros indicadores clave como la eficiencia terminal, la deserción y el rezago educativo. La metodología empleada se basó en el enfoque CRISP–DM, que permitió estructurar el análisis en fases bien definidas: compresión de la institución, comprensión de los datos, preparación de los datos, modelado, evaluación y despliegue. Se trabajó con un conjunto de datos históricos proporcionado por la USEBEQ, que incluyó registros académicos de primero y segundo grado de secundaria, datos institucionales, demográficos y variables complementarias. Como parte del tratamiento previo a la modelación, se aplicaron técnicas de ingeniería de características, balanceo mediante SMOTE, codificación de variables categóricas, selección de variables por relevancia estadística (SelectBest), escalado de características y validación cruzada estratificada. Se evaluaron múltiples algoritmos de clasificación supervisada, entre ellos, regresión logística, Random Forests, XGBoost, LightGBM, redes neuronales (Keras y Scikit–learn), así como un algoritmo de ensamble. Los modelos fueron comparados a partir de métricas centradas en la detección efectiva de la clase minoritaria (reprobación), entre las que se incluyeron: F1–score, precision, recall, MCC (Matthews Correlation Coefficient), coeficiente de Kappa, exactitud balanceada (Balanced Accuracy), área bajo la curva ROC (ROC–AUC), área bajo la curva precisión–recall (PR–AUC), mejora relativa frente al azar y una puntuación compuesta tipo WSM (Weighted Sum Model). El modelo seleccionado fue LightGBM por presentar un desempeño destacado en sus métricas, manteniendo un balance adecuado entre sensibilidad y especificidad. Estos resultados sugieren que LightGBM es una alternativa robusta y eficiente para identificar estudiantes en riesgo y apoyar decisiones pedagógicas oportunas. El modelo puede ser integrado como una herramienta de análisis institucional de la USEBEQ para diseñar intervenciones preventivas y focalizadas que contribuyan a mejorar los indicadores de permanencia y logro educativo. es_ES
dc.format pdf es_ES
dc.format.extent 1 recurso en línea (179 páginas) es_ES
dc.format.medium computadora es_ES
dc.language.iso spa es_ES
dc.publisher Universidad Autonoma de Querétaro es_ES
dc.relation.requires Si es_ES
dc.rights openAccess es_ES
dc.subject Aprendizaje automático es_ES
dc.subject Ciencia de datos es_ES
dc.subject LightGBM es_ES
dc.subject Políticas públicas preventivas es_ES
dc.subject Predicción escolar es_ES
dc.subject.classification CIENCIAS SOCIALES es_ES
dc.title Ciencia de Datos e AI: Análisis del indicador de reprobación en Educación Secundaria General es_ES
dc.type Tesis de maestría es_ES
dc.creator.tid ORCID es_ES
dc.contributor.tid ORCID es_ES
dc.creator.identificador 0009-0002-9889-1333 es_ES
dc.contributor.identificador 0000-0003-2503-1332 es_ES
dc.contributor.role Director de tesis es_ES
dc.degree.name Maestría en Gestión e Innovación Pública es_ES
dc.degree.department Facultad de Contaduría y Administraciónía es_ES
dc.degree.level Maestría es_ES
dc.format.support recurso en línea es_ES
dc.matricula.creator 95255 es_ES
dc.folio CAMAN-95255 es_ES


Ficheros en el ítem

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem