Sistema de pbkp_redicción de la complejidad léxica implementando machine learning y redes neuronales para reducir barreras de la compresión lectora en los estudiantes universitarios.
Abstract:
La identificación de palabras complejas (CWI) es la tarea de detectar en el contenido de los documentos las palabras que son difíciles o complejas de entender por las personas de un determinado grupo. El objetivo de esta investigación es el desarrollo de un sistema de pbkp_redicción de la complejidad léxica tanto del idioma inglés como del idioma español. El sistema se basa en la implementación de características lingüísticas a nivel de la palabra y oraciones, y en la implementación de las técnicas de redes neuronales BERT y XLM-RoBERTa para la generación de nuevas características que permitan resultados mucho más precisos. Se aplicó el algoritmo Random Forest Regressor. Para el entrenamiento de algoritmo se utilizó un conjunto de datos conformado por un corpus de textos en español y otro corpus de textos en inglés. La evaluación del algoritmo se lo realizó mediante la partición 90% - 10%. La metodología de desarrollo que se aplicó fue Kanban, y la metodología de investigación se basó en el Estudio de Caso por lo cual sus unidades de análisis se fundamentaron en las características lingüísticas generadas. Tras varias ejecuciones del algoritmo fue necesario implementar una validación cruzada de 5 variaciones para lograr resultados más precisos. El sistema será de mucho beneficio para la generación de soluciones dirigidas a los estudiantes con bajo nivel de comprensión lectora.
Año de publicación:
2021
Keywords:
- Supervised learning
- Características línguísticas
- COMPLEJIDAD LÉXICA
- Neural networks
- Lexical Complexity
- Machine learning
- Redes Neuronales
- pbkp_rediction
- Pbkp_redicción
- Linguistic characteristics
Fuente:
Tipo de documento:
Bachelor Thesis
Estado:
Acceso abierto
Áreas de conocimiento:
- Aprendizaje automático
- Tecnología educativa
Áreas temáticas:
- Funcionamiento de bibliotecas y archivos
- Educación
- Métodos informáticos especiales