Modelado de tópicos, una revisión sistemática de la literatura científica de Latent Dirichlet Allocation LDA.
Abstract:
El propósito del presente trabajo de investigación es realizar un análisis bibliométrico de la literatura científica de las bases de datos Scopus, ScienceDirect y Web of Science para la extracción de los artículos de los últimos 10 años referentes al modelo probabilístico Latent Dirichlet Allocation (LDA) y aplicar el mismo modelo por medio del programa LDAShiny a aquella base de datos obtenida. Se logró reconocer los indicadores bibliométricos más relevantes de los resultados, además de los 18 tópicos con mayor coherencia probabilística dentro del corpus, siendo los términos principales: aprendizaje automático, salud del corazón y extracción de texto, además se propuso 18 tópicos de acuerdo al análisis de textos en cuanto a la matriz Phi que presenta la probabilidad posteriori por tópico por palabra. Finalmente se presentó el dendograma Ciencia de Datos el cual representa la agrupación jerárquica de los tópicos de acuerdo a la cantidad óptima de cluster definidos
Año de publicación:
2023
Keywords:
- PROYECTOS NUEVOS
- Análisis bibliométrico
- ASIGNACIÓN LATENTE DE DIRICHLET
- APRENDIZAJE AUTOMÁTICO
Fuente:

Tipo de documento:
Bachelor Thesis
Estado:
Acceso abierto
Áreas de conocimiento:
- Minería de datos
- Ciencias de la computación
Áreas temáticas:
- Conocimiento