Evaluación de la pbkp_redicción del nivel de complejidad de las palabras en los estudios de derecho aplicando el modelo de lenguaje basado en Transformers XLM-RoBERTa


Abstract:

Este proyecto de investigación pretende lograr el mejoramiento del nivel de pbkp_redicción de complejidad de las palabras en idioma español mediante la aplicación de Deep Learning y su modelo de lenguaje basado en Transformers, específicamente los dirigidos a español XLM-RoBERTa. El objetivo del proyecto busca contribuir a la reducción de las barreras de la comprensión lectora de los estudiantes de la carrera de Derecho de la Universidad de Guayaquil mediante la evaluación de los resultados generados de la ejecución del modelo. Se aplicaron las técnicas de Masked Language Modeling y Fine-Tuning para lograr una mejor precisión en la pbkp_redicción de la complejidad. Se utilizó el corpus CEDUG (Complejidad léxica en los Estudios de Derecho de la Universidad de Guayaquil) el cual es un corpus etiquetado por los estudiantes de la carrera de Derecho. Este Dataset contiene textos extraídos de diferentes documentos jurídicos provenientes de varias fuentes como la Constitución del Ecuador y proyectos de titulación de la carrera de Derecho. Para el proceso de entrenamiento y evaluación se aplicaron las métricas del error común MAE, MSE, RMSE, y otras orientadas a la evaluación de la complejidad de las palabras como son R2 y Pearson. La población estuvo conformada por los estudiantes de la carrera de Derecho. La metodología de investigación que se aplicó fue cuantitativa y un muestreo por estratos. Adicional a este estudio se realizó una contribución en el cual se aplicaron otros modelos de lenguaje para el idioma español, los cuales fueron XLM-RoBERTa-base, XLM-RoBERTa-Large, RoBERTa-Large-BNE.

Año de publicación:

2023

Keywords:

  • MODELO DE LENGUAJE
  • PREDICCIÓN
  • Corpus
  • deep learning
  • PREDICTION
  • Language model
  • Fine-Tuning
  • TRANSFORMERS

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Inteligencia artificial

Áreas temáticas:

  • Derecho
  • Administración pública y ciencia militar
  • Lingüística