Evaluación del marco de trabajo Hadoop y Power View en la Visualización de Trayectorias GPS Vehicular [Evaluation framework Hadoop and Power View display in GPS Vehicle …


Abstract:

El presente artículo describe la evaluación del marco de trabajo Hadoop y del complemento Power View de Excel a través de un experimento de análisis de gran volumen de información de trayectorias GPS vehiculares. Con la finalidad de hacer un estudio que permita utilizar las herramientas propias de Hadoop, se utiliza un Dataset de EEUU con información de camiones y sus rutas respectivas. Esta investigación se desarrolló siguiendo las siguientes fases: 1) selección del ambiente de trabajo donde vemos cuales son las características óptimas y el hardware necesario para trabajar con Hadoop, 2) realizar la configuración del ambiente y características para el análisis de trayectorias GPS, 3) la carga, análisis y visualización de resultados. Se estudia el uso de Hive como almacén de datos y para la transformación de las tablas a un formato ORC que facilita el procesamiento de la información. En la etapa de análisis de Datos se usó MapReduce para realizar algoritmos y PIG para hacer un estudio de riesgos mediante conversiones de código SQL. Por último se visualiza e interpreta los resultados con Power View una característica de Microsoft Excel 2013, que muestra un mapa con todas las coordenadas GPS de los vehículos, donde mediante técnicas de análisis pudimos concluir que el 40% de los accidentes en las carreteras de California EE UU se ocasiona por la fatiga de los conductores. Para futuros trabajos se procederá a generar trayectorias GPS de la ciudad de Guayaquil para determinar patrones en su comportamiento.

Año de publicación:

2016

Keywords:

    Fuente:

    googlegoogle

    Tipo de documento:

    Other

    Estado:

    Acceso abierto

    Áreas de conocimiento:

    • Análisis de datos
    • Ciencias de la computación

    Áreas temáticas:

    • Ciencias de la computación

    Contribuidores: