Procesamiento de altas prestaciones (paralelo y distribuido) en el cl?ster de Cedia utilizando el lenguaje r con datos de ?ndices clim?ticos para el ecuador continental


Abstract:

El Lenguaje R es especializado para el an?lisis de datos estad?sticos, sin embargo cuando el volumen de datos es muy elevado, R se vuelve ineficiente y requiere de una cantidad considerable de tiempo para el procesamiento Por ello se han desarrollado librer?as para el procesamiento en paralelo y distribuido siguiendo las directrices de High Performance Computing (HPC). A pesar de estos esfuerzos, la aplicaci?n de las librer?as es limitada, ya sea por el poco acceso a los equipos HPC o porque la documentaci?n es escasa y demasiado t?cnica. Por ello, este trabajo implement? y document? el uso de librer?as de R para el procesamiento en paralelo y distribuido aplicado al an?lisis de teleconexiones e ?ndices clim?ticos para el Ecuador continental. Se utilizaron series temporales de im?genes satelitales de precipitaci?n de diez a?os e ?ndices clim?ticos. Se utiliz? la librer?a Parallel y RSLURM en el cl?ster HPC de CEDIA para aplicar correlaci?n de Spearman y bootstrap. Se midieron los tiempos de procesamiento secuencial, en paralelo y distribuido, observando disminuciones considerables de tiempo a medida que se aumenta el n?mero de procesadores y nodos

Año de publicación:

2018

Keywords:

  • CL?STER
  • R
  • Parallel
  • HIGH PERFORMANCE COMPUTING
  • TELECONEXIONES CLIM?TICAS
  • RSLURM

Fuente:

rraaerraae

Tipo de documento:

Bachelor Thesis

Estado:

Acceso abierto

Áreas de conocimiento:

  • Análisis de datos
  • Estadísticas

Áreas temáticas:

  • Ciencias de la computación