{"title":"提高使用机器学习方法开发的入侵检测模型的性能,并对数据集进行预处理","authors":"Esen Gül İLGÜN, Refik SAMET","doi":"10.17341/gazimmfd.1122021","DOIUrl":null,"url":null,"abstract":"Son yıllarda yapay zekâ teknikleri kullanılarak geliştirilen siber saldırılar sızdıkları sistemin kullanıcı davranışlarını öğrenerek sisteme başarılı bir şekilde entegre olabilmekte ve bu sayede geleneksel güvenlik yazılımları tarafından tespit edilememektedir. Çeşidi ve sayısı hızla artan bu tür siber saldırılar anomali tabanlı Saldırı Tespit Sistemleri (STS) tarafından tespit edilebilmektedir. Ancak bu tür STS’lerin performansları yeterli olmadığı için STS’lerin performanslarının iyileştirilmesi ile ilgili yapılan araştırmaların önemi de artmaktadır. Bu çalışmada, anomali tabanlı saldırı tespit modellerinin tespit hızını ve doğruluğunu arttırmak için dört aşamalı bir metodoloji önerilmiştir. Bu metodoloji kapsamında kullanılan NSL-KDD veri setine ilk önce ön işlem uygulanmadan, daha sonra sırasıyla kategorik veri kodlama, ölçeklendirme, hibrit öznitelik seçimi ön işlemleri ayrı ayrı ve birlikte uygulanarak farklı veri setleri elde edilmiştir. Elde edilen veri setleri ve K-Nearest Neighbor (KNN), Multi Layer Perceptron (MLP), Random Forest (RF), eXtreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM) makine öğrenimi algoritmaları kullanılarak çok sayıda saldırı tespit modeli oluşturulmuştur. Son olarak en başarılı sonuçların elde edildiği modellerde hiper-parametre optimizasyonu yapılarak modellerin performansları iyileştirilmiştir. Çalışmanın sonunda eğitim veri seti üzerinde 0,373 s sürede %96,1 saldırı tespit başarısına, test veri seti üzerinde ise 0,005 s sürede %100 saldırı tespit başarısına ulaşılmıştır.","PeriodicalId":51103,"journal":{"name":"Journal of the Faculty of Engineering and Architecture of Gazi University","volume":"117 1","pages":"0"},"PeriodicalIF":1.0000,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Veri setine uygulanan ön işlemler ile makine öğrenimi yöntemi kullanılarak geliştirilen saldırı tespit modellerinin performanslarının arttırılması\",\"authors\":\"Esen Gül İLGÜN, Refik SAMET\",\"doi\":\"10.17341/gazimmfd.1122021\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Son yıllarda yapay zekâ teknikleri kullanılarak geliştirilen siber saldırılar sızdıkları sistemin kullanıcı davranışlarını öğrenerek sisteme başarılı bir şekilde entegre olabilmekte ve bu sayede geleneksel güvenlik yazılımları tarafından tespit edilememektedir. Çeşidi ve sayısı hızla artan bu tür siber saldırılar anomali tabanlı Saldırı Tespit Sistemleri (STS) tarafından tespit edilebilmektedir. Ancak bu tür STS’lerin performansları yeterli olmadığı için STS’lerin performanslarının iyileştirilmesi ile ilgili yapılan araştırmaların önemi de artmaktadır. Bu çalışmada, anomali tabanlı saldırı tespit modellerinin tespit hızını ve doğruluğunu arttırmak için dört aşamalı bir metodoloji önerilmiştir. Bu metodoloji kapsamında kullanılan NSL-KDD veri setine ilk önce ön işlem uygulanmadan, daha sonra sırasıyla kategorik veri kodlama, ölçeklendirme, hibrit öznitelik seçimi ön işlemleri ayrı ayrı ve birlikte uygulanarak farklı veri setleri elde edilmiştir. Elde edilen veri setleri ve K-Nearest Neighbor (KNN), Multi Layer Perceptron (MLP), Random Forest (RF), eXtreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM) makine öğrenimi algoritmaları kullanılarak çok sayıda saldırı tespit modeli oluşturulmuştur. Son olarak en başarılı sonuçların elde edildiği modellerde hiper-parametre optimizasyonu yapılarak modellerin performansları iyileştirilmiştir. Çalışmanın sonunda eğitim veri seti üzerinde 0,373 s sürede %96,1 saldırı tespit başarısına, test veri seti üzerinde ise 0,005 s sürede %100 saldırı tespit başarısına ulaşılmıştır.\",\"PeriodicalId\":51103,\"journal\":{\"name\":\"Journal of the Faculty of Engineering and Architecture of Gazi University\",\"volume\":\"117 1\",\"pages\":\"0\"},\"PeriodicalIF\":1.0000,\"publicationDate\":\"2023-04-11\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of the Faculty of Engineering and Architecture of Gazi University\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.17341/gazimmfd.1122021\",\"RegionNum\":4,\"RegionCategory\":\"工程技术\",\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q3\",\"JCRName\":\"ENGINEERING, MULTIDISCIPLINARY\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of the Faculty of Engineering and Architecture of Gazi University","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.17341/gazimmfd.1122021","RegionNum":4,"RegionCategory":"工程技术","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
Veri setine uygulanan ön işlemler ile makine öğrenimi yöntemi kullanılarak geliştirilen saldırı tespit modellerinin performanslarının arttırılması
Son yıllarda yapay zekâ teknikleri kullanılarak geliştirilen siber saldırılar sızdıkları sistemin kullanıcı davranışlarını öğrenerek sisteme başarılı bir şekilde entegre olabilmekte ve bu sayede geleneksel güvenlik yazılımları tarafından tespit edilememektedir. Çeşidi ve sayısı hızla artan bu tür siber saldırılar anomali tabanlı Saldırı Tespit Sistemleri (STS) tarafından tespit edilebilmektedir. Ancak bu tür STS’lerin performansları yeterli olmadığı için STS’lerin performanslarının iyileştirilmesi ile ilgili yapılan araştırmaların önemi de artmaktadır. Bu çalışmada, anomali tabanlı saldırı tespit modellerinin tespit hızını ve doğruluğunu arttırmak için dört aşamalı bir metodoloji önerilmiştir. Bu metodoloji kapsamında kullanılan NSL-KDD veri setine ilk önce ön işlem uygulanmadan, daha sonra sırasıyla kategorik veri kodlama, ölçeklendirme, hibrit öznitelik seçimi ön işlemleri ayrı ayrı ve birlikte uygulanarak farklı veri setleri elde edilmiştir. Elde edilen veri setleri ve K-Nearest Neighbor (KNN), Multi Layer Perceptron (MLP), Random Forest (RF), eXtreme Gradient Boosting (XGBoost), Light Gradient Boosting Machine (LightGBM) makine öğrenimi algoritmaları kullanılarak çok sayıda saldırı tespit modeli oluşturulmuştur. Son olarak en başarılı sonuçların elde edildiği modellerde hiper-parametre optimizasyonu yapılarak modellerin performansları iyileştirilmiştir. Çalışmanın sonunda eğitim veri seti üzerinde 0,373 s sürede %96,1 saldırı tespit başarısına, test veri seti üzerinde ise 0,005 s sürede %100 saldırı tespit başarısına ulaşılmıştır.
期刊介绍:
Gazi University Journal of the Faculty of Engineering and Architecture; Engineering qualifications described below and in the field of architecture research papers and invited articles by scanning is considered to be Turkish.