Detección de preguntas duplicadas en sitios Stack Overflow (Español e Inglés).


Abstract:

Stack Overflow es una comunidad de preguntas y respuestas y son las preferidas de los programadores para resolver sus dudas. El sitio Stack Overflow en español se inició como alternativa al sitio en inglés pensado para ser utilizado por personas hispanohablantes. Sin embargo, muchas veces sus usuarios prefieren realizar sus preguntas también en el sitio inglés con el fin de obtener una respuesta de manera más rápida creando preguntas duplicadas en ambos sitios. La tarea de detectar estas preguntas duplicadas no se realiza ni siquiera por los moderadores de los sitios por lo que algunos investigadores han intentado abordar el problema utilizando técnicas de procesamiento qué lenguaje natural y aprendizaje automático. En este proyecto se realizará un análisis de la literatura mediante una revisión sistemática para determinar cuáles son las herramientas y técnicas más utilizadas por los investigadores. Luego se extraerán los datos de los sitios a fin de crear un dataset con pares de preguntas que serán utilizadas para los experimentos. Como experimentos se utilizarán las técnicas y herramientas analizadas en la revisión sistemática para desarrollar algoritmos cuyos resultados serán contrastados mediante un juicio externo para determinar si el rendimiento del mismo es suficiente para comprobar la hipótesis planteada, es decir, si la aplicación de técnicas de aprendizaje automático y procesamiento del lenguaje natural ayuda en la detección de preguntas duplicadas entre los sitios Stack Overflow y Stack Overflow en español.

Año de publicación:

2021

Keywords:

  • STACK OVERFLOW
  • APRENDIZAJE AUTOMÁTICO
  • Procesamiento de lenguaje natural
  • Machine learning
  • Preguntas duplicadas
  • Multilingüe
  • Duplicate questions
  • Natural Language processing
  • Multilingual

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Aprendizaje automático
  • Software

Áreas temáticas de Dewey:

  • Funcionamiento de bibliotecas y archivos
Procesado con IAProcesado con IA

Objetivos de Desarrollo Sostenible:

  • ODS 4: Educación de calidad
  • ODS 17: Alianzas para lograr los objetivos
  • ODS 9: Industria, innovación e infraestructura
Procesado con IAProcesado con IA