Analíticas de aprendizaje y análisis estadístico implicativo: comparación de la complejidad temporal de técnicas clúster para bases de datos de tamaño 100000 con variables modales


Abstract:

Al analizar datos provenientes de múltiples procesos económicos, sociales, administrativos, científicos, se tiende a presentar problemas o en ciertos casos llegan a ser procesos irrealizables debido a que no se consideran técnicas óptimas y adecuadas desde el punto de vista de la complejidad temporal (tiempo de ejecución o procesamiento); es por ello por lo que es importante investigar cuáles técnicas clúster son las más rápidas en el procesamiento de información. Las técnicas clúster permiten formar grupos de datos homogéneos con grupos heterogéneos entre sí. El presente trabajo comparó desde el punto de vista de la complejidad temporal las técnicas clúster del Análisis Estadístico Implicativo (ASI) y las de LA (Analíticas de aprendizaje). Para determinar cuál (o cuáles) técnicas son las más rápidas se utilizó una investigación cualitativa pre-experimental del tipo RGXO 1, donde RG representa el grupo experimental (aleatorio), X representa el tratamiento que en este caso son las 5 técnicas clúster (3 técnicas de LA y 2 técnicas de ASI) y O es el tiempo de ejecución. Las técnicas Tsim Chic y TcoheChic del ASI se demostraron que son las más rápidas para bases de datos de tamaño 100000 o 1000 observaciones y 100 variables con datos categóricos de hasta 10 categorías, que se sugiere utilizar si se trabaja en hardware no muy actual y se necesitan procesos clúster de rápida ejecución.

Año de publicación:

2022

Keywords:

    Fuente:

    googlegoogle

    Tipo de documento:

    Other

    Estado:

    Acceso abierto

    Áreas de conocimiento:

    • Análisis de datos
    • Estadísticas

    Áreas temáticas:

    • Programación informática, programas, datos, seguridad
    • Métodos informáticos especiales
    • Ciencias sociales

    Contribuidores: