Detección de tópicos de texto en español utilizando técnicas de Machine Learning y atribución de autoria: Caso discursos Guillermo Lasso Presidente del Ecuador.
Abstract:
El presente trabajo de titulación tiene como objetivo analizar y estudiar el estado del arte de la atribución de autoría y asignación de tópicos de textos en español tomando como referencia artículos científicos enfocados sobre el tema los cuales serán escogidos de fuentes confiables, también se investigarán las distintas técnicas de machine learning para el modelado de tópicos en corpus de texto con la finalidad de evaluar los modelos e identificar cuáles están más orientados a la detección de tópicos en el idioma español. Además, se procederá a evaluar los modelos LDA y NMF para el procesamiento de lenguaje natural, modelado y detección de tópicos usando como lenguaje de programación Python para el análisis de los diferentes discursos del Sr. Guillermo Lasso, presidente del Ecuador, los mismos que serán tomados de forma aleatoria de páginas oficiales, con lo que se generará un análisis comparativo de los dos modelos antes mencionados. Se concluye presentando los diferentes resultados obtenidos por ambos modelos en su proceso de evaluación de los diferentes discursos políticos del primer mandatario del Ecuador.
Año de publicación:
2022
Keywords:
- Atribución de Autor
- Topic modeling
- Author attribution
- Algoritmos
- APRENDIZAJE AUTOMÁTICO
- Topics detection
- Modelado de Tópicos
- ALGORITHMS
- Detección de Tópicos
- Machine learning
Fuente:

Tipo de documento:
Bachelor Thesis
Estado:
Acceso abierto
Áreas de conocimiento:
- Aprendizaje automático
Áreas temáticas de Dewey:
- Programación informática, programas, datos, seguridad
- Interacción social
- Literatura y retórica