Regresar

Un nuevo corpus etiquetado para la investigación de las palabras complejas en la carrera de Derecho de la Universidad de Guayaquil”

Abstract:

Este proyecto de titulaciòn plantea analizar el nivel de complejidad léxica a través de la creación de un corpus de textos universitarios en idioma español como desarrollo de herramienta efectiva para continuar las investigaciones en el área de la Simplificación Léxica del campo del PLN. Con la creación de este corpus los estudiantes de la carrera de Derecho podrán hacer la respectiva identificación y anotación de las palabras para su comprensión. Se aplicó la metodología de desarrollo Kamban la misma que se encuentra basada en Estudios de Casos, por lo cual sus unidades de análisis se fundamentaron en las características lingüísticas generadas mediante la aplicación de un conjunto de métricas de la complejidad léxica. Posteriormente se obtuvieron los respectivos gráficos estadísticos para evaluar la eficacia del proceso del etiquetado de las palabras complejas anotadas en el corpus, dicho proceso se llevó a cabo a través de la creación de varios scripts de programación, obteniendo como resultado una alta complejidad en los textos que conforman el corpus. En conclusión, el corpus creado ayuda en la identificación de las palabras complejas que causan barreras en la comprensión lectora en los estudiantes universitarios de la carrera de Derecho.