Análisis de herramientas de extracción de comentarios de la red social twitter y creación de un corpus no relacional para el posterior uso en el procesamiento de lenguaje natural (PLN), y minería de opiniones (MO).


Abstract:

El presente trabajo se realizó con el objetivo general de analizar las herramientas de mayor uso en la extracción de comentarios de la red social Twitter, demostrando su utilidad con la creación de un corpus no relacional para uso en el Procesamiento de Lenguaje Natural (PLN) y Minería de Opiniones (MO). Para la orientación teórica se establecieron los antecedentes históricos de temas relacionados con la investigación, así como el desarrollo teórico de temas como el Procesamiento de Lenguaje Natural, extracción de datos, datos estructurados, redes sociales, lenguajes de programación (Python) y otras herramientas digitales. Se utilizó el tipo de investigación exploratoria y de proyectos factibles, y se desarrolló con el análisis de 30 documentos académicos y revistas científicas de 20 fuentes bibliográficas relacionadas con Procesamiento de lenguaje natural (PLN) y Minería de opiniones (MO). Es significativo resaltar la importancia de adaptarse a las nuevas tecnologías emergentes, la presente investigación parte de la jerarquía que tiene la utilización de bases de datos NoSQL para resolver necesidades de almacenamiento, respaldo, disponibilidad, escalabilidad y manejo de información relacional. El final de la investigación obtuvo como resultado la interpretación y análisis de las herramientas adecuadas para la extracción de comentarios de la red social Twitter, concluyendo la viabilidad de llevar a cabo la propuesta de la creación del corpus no relacional.

Año de publicación:

2021

Keywords:

  • Twitter
  • Minería de opciones
  • PLN
  • Bases de Datos
  • Option Mining
  • DATABASES
  • Corpus

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Minería de datos
  • Ciencias de la computación

Áreas temáticas de Dewey:

  • Funcionamiento de bibliotecas y archivos
  • Lingüística
  • Lengua