Clasificación automática de texto en variables PEST a través de representaciones vectoriales.
Abstract:
El presente proyecto tiene como finalidad la creación de un clasificador de texto en variables Pest a través de representaciones vectoriales, el texto especifico a clasificar serán los tweets de la red social Twitter, en beneficios a las organizaciones en su toma de decisión al momento de recolectar información dentro del contextos Pest (Político, Económico, Social y Tecnológico) dado que en Twitter existe mucha información, pero la cual esta desordenada y con una gran diversidad de tópicos que en muchos caso no son necesario al momento de tomar decisiones, dicha información se guardara en una categoría general, en el caso que se necesite en el futuro. En la realización del clasificador se utilizó el lenguaje de programación Python, y las librerías Gensim, tensorflow, Flask, Flask-MySQL, pandas entre otras para el entrenamiento del clasificador y la interfaz web para una mejor usabilidad, la metodología que se adata a todos los objetivos dentro del proyecto fue CRISP-DM. En conclusión, se cumplieron con todos los objetivos del proyecto, dando así un clasificador con 70% de acierto al momento de clasificar los tweets de Twitter los cuales se pueden observar a través de la página web realizada.
Año de publicación:
2022
Keywords:
- desarrollo de software
- GENSIM
- PYTHON
- CLASIFICADOR DE TEXTO
Fuente:
Tipo de documento:
Bachelor Thesis
Estado:
Acceso abierto
Áreas de conocimiento:
- Aprendizaje automático
Áreas temáticas:
- Programación informática, programas, datos, seguridad