Evaluación de contenido de entrada y posible salida en conversaciones textuales de personas contagiadas de COVID-19 para identificar un modelo PLN efectivo por medio del entrenamiento de Machine Learning del FCI 010-2021.


Abstract:

El text mining es el proceso de examinar grandes volúmenes de documentos para descubrir nueva información o ayudar a responder preguntas de investigación específicas. Este ha generado un gran aporte tecnológico dando lugar a la creación de portales donde era compartida la información detallada de la situación que pasaban diversos paises en la pandemia, tomando información de páginas web oficiales donde publicaban los contagios por Covid-19 y fallecidos actualizados permitiendo de esta manera a la población conocer cómo se expandía a diario el virus y así este mayormente informada de nuevas variantes y posibles olas de contagio. En este trabajo de titulación desarrollo diversos modelos como son Long-Short Term Memory (LSTM), modelo básico Artificial Neural Network (ANN), Random Forest para multilabel y KNeighborsClassifier (kNN) en los cuales se pretende proporcionar un módulo aplicando algoritmos supervisados con arquitecturas NLP con la finalidad de detectar patrones de recomendaciones más comunes dadas por los médicos especialistas del Ecuador a los pacientes contagiados del virus Covid-19 en la fase de acompañamiento médico o post Covid más efectivas dadas por ellos entre el mes de marzo del año 2020 a marzo del año 2022. Llegando a la conclusión que el modelo básico ANN con los parámetros ajustados llega a ser el más efectivo dando los siguientes resultados accuracy train de 88%, una precisión train de 94%, recall train 92% y auc train 98%, seguido de los datos de test accuracy test 75%, precisión test 82%, recall test 78% y auc test de 93%.

Año de publicación:

2022

Keywords:

  • TECNOLOGIA DE LOS ORDENADORES
  • Algoritmos
  • NLP
  • MODULO

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Aprendizaje automático
  • Ciencias de la computación

Áreas temáticas:

  • Lingüística
  • Ciencias de la computación
  • Física aplicada