Sistema de predicción de la complejidad léxica para contribuir a la reducción de las barreras de la comprensión lectora en el idioma inglés.


Abstract:

El aprendizaje del idioma inglés es fundamental en la nueva era de la globalización, sin embargo, se vuelve complejo por el vocabulario sofisticado que ciertos textos están redactados. El propósito de esta investigación es implementar un sistema de predicción de la complejidad léxica aplicando Machine Learning para contribuir a la reducción de las barreras de la compresión lectora en el idioma inglés. En el presente proyecto hacemos uso de la investigación básica que permitió obtener y recopilar información. El proyecto hace uso de la investigación descriptiva debido a que el propósito final de nuestro trabajo es realizar la tarea de predicción, es decir los resultados finales del sistema estarán sujetos a entrenamiento y predicción. Con respecto a lo indicado, se utilizaron 2 tipo de DataSet que están distribuidas para el entrenamiento y para realizar pruebas, las mismas que se utilizó para poder extraer características como la longitud de la palabra, frecuencia de las palabras, Part Of Speech, números de sinónimos, etc., tanto para las palabras complejas como las palabras del contexto(oración), después se ajustó al modelo Random Forest Regressor la cual obtuvimos la predicción de la complejidad de las palabras en una Scala de Likert. El mejor resultado se obtuvo mediamente medidas de rendimiento como el MAE= 0.073479632, MSE=0.009383993, RMSE=0.096871012. En conclusión, el sistema desarrollado en este proyecto nos proporciona valores de complejidad de las palabras analizadas, dichos valores son calculados mediante la predicción utilizando el algoritmo de aprendizaje supervisado (Random Forest Regressor). Como recomendación, entrenar el algoritmo con un corpus más extenso y con mayor diversidad de palabras para que las predicciones sean más precisas y se puedan ajustar mejor al modelo Random Forest Regressor.

Año de publicación:

2021

Keywords:

  • Likert scale
  • Escala de Likert
  • Complex word identification
  • Lexical Complexity
  • Procesamiento de lenguaje natural
  • Identificación de palabras complejas
  • Pbkp_redicción de palabras complejas
  • Natural Language processing
  • COMPLEJIDAD LÉXICA
  • Complex word pbkp_rediction

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Adquisición del lenguaje

Áreas temáticas de Dewey:

  • Funcionamiento de bibliotecas y archivos
Procesado con IAProcesado con IA

Objetivos de Desarrollo Sostenible:

  • ODS 4: Educación de calidad
  • ODS 17: Alianzas para lograr los objetivos
  • ODS 9: Industria, innovación e infraestructura
Procesado con IAProcesado con IA