Modelo de detección de intrusos para detectar y evitar la inserción de Malware en una red, basado en técnicas de aprendizaje automático.
Abstract:
Los ciberataques son uno de los principales problemas que afectan a las empresas a nivel mundial. Los causantes detrás de los ataques son conocidos como ciberdelincuentes. Estos aprovechan vulnerabilidades existentes en los sistemas informáticos para efectuar el ataque, ocasionando robo de información confidencial y pérdidas económicas para las empresas u organizaciones afectadas. Es por ello que se busca una alternativa para disminuir este problema, una opción a considerar es el aprendizaje automático como herramienta para mejorar la seguridad informática. El presente trabajo de titulación tuvo como finalidad presentar un modelo de detección de intrusos que hace uso de la tecnica propuesta en el presente trabajo de titulación, la cual combina las técnicas filter y wrapper para la selección de características en la fase de preprocesamiento de datos. El conjunto de datos utilizado para el entrenamiento y prueba de los modelos fue obtenido del repositorio GitHub2 . Se utilizaron algoritmos de clasificación para el entrenamiento de los modelos. En base a la métrica de exactitud se seleccionó al mejor modelo de detección de intrusos, el cual fue entrenado mediante el algoritmo RandomForest. Este modelo consiguió una media del 99,42% de exactitud con la técnica de selección de características propuesta, mejorando en un 0.10% al resultado del modelo entrenado con el mismo algoritmo pero sin el uso de la metodología propuesta. Con ello se evidencia que los modelos entrenados con la metodología propuesta proporcionan rendimientos similares a los modelos que no hacen uso de la misma, contando con 2 Disponible en: https://github.com/Te-k/malware-classification/blob/master/data.csv 23 la ventaja de eliminar aquellas características redundantes del conjunto de datos.Cabe mencionar que, el tiempo de entrenamiento de los modelos con cada unos de los algoritmos para poder evaluar su desempeño y seleccionar al mejor fue de aproximadamente un minuto con diez segundos.
Año de publicación:
2021
Keywords:
- Ciberataque
- Selección de subconjunto de características
- APRENDIZAJE AUTOMÁTICO
- Machine learning
- filter
- filter
- Feature Subset Selection
- Conjunto de datos
- wrapper
- wrapper
- Data set
- cyberattack
Fuente:
Tipo de documento:
Bachelor Thesis
Estado:
Acceso abierto
Áreas de conocimiento:
- Aprendizaje automático
- Ciencias de la computación
Áreas temáticas:
- Programación informática, programas, datos, seguridad
- Funcionamiento de bibliotecas y archivos
- Instrumentos de precisión y otros dispositivos