Decision Tree and K-Nearest Neighbor (K-NN) Algorithm Based on Particle Swarm Optimization (PSO) for Diabetes Mellitus Prediction Accuracy Analysis

A. Rachman, S. Supratman, Euis Nur Fitriani Dewi
{"title":"Decision Tree and K-Nearest Neighbor (K-NN) Algorithm Based on Particle Swarm Optimization (PSO) for Diabetes Mellitus Prediction Accuracy Analysis","authors":"A. Rachman, S. Supratman, Euis Nur Fitriani Dewi","doi":"10.24114/cess.v7i2.34245","DOIUrl":null,"url":null,"abstract":"Penyakit Diabetes Mellitus merupakan penyakit tidak menular, tetapi penyakit ini  merupakan salah satu penyakit yang mematikan bagi yang mengidapnya. Penyakit ini disebabkan oleh beberapa factor diantaranya pola makan hidup yang tidak teratur atau berlebihan. Apabila penyakit ini tidak dihentikan, maka penderita penyakit Diabetes Mellitus akan semakin memakan para pasien penderita penyakit ini. Menurut WHO atau World Health Organization, sekitar 425 juta orang menderita penyakit diabetes, kemudian 1,6 juta kematian setiap tahunnya di akibatkan oleh penyakit diabetes. Kemudian, pada tahun 2016 di Indonesia, kematian yang disebabkan oleh penyakit diabetes sekitar 99 ribu jiwa. Penyakit diabetes pada tahun ke tahun semakin meningkat, jadi perlu adanya sebuah sistem yang dapat membantu medis untuk melakukan klasifikasi terhadap diabetes berdasarkan data kesehatan pasien. Salah satu metode yang dapat digunakan untuk memprediksi penyakit diabetes mellitus adalah dengan menggunakan data mining. Data mining merupakan suatu proses yang interaktif untuk memprediksi penyakit diabetes mellitus. Prediksi untuk mendiagnosis penyakit ini menggunakan seleksi fitur berbasis Particle Swarm Optimization (PSO) pada dataset Kaggle.com. Dan metode klasifikasi yang digunakan yaitu metode Decision Tree dan K-Nearest Neighbors (K-NN). Hasil dari penelitian ini menghasilkan nilai akurasi tertinggi sebanyak 79.8% dengan AUC 0.71 dengan menggunakan metode Decision Tree, dan untuk menggunakan optimasi metode K-Nearest Neighbors (K-NN) menggunakan Particle Swarm Optimization (PSO) memiliki nilai akurasi tertinggi sebanyak 77.09%.","PeriodicalId":53361,"journal":{"name":"CESS Journal of Computer Engineering System and Science","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2022-07-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"CESS Journal of Computer Engineering System and Science","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24114/cess.v7i2.34245","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Penyakit Diabetes Mellitus merupakan penyakit tidak menular, tetapi penyakit ini  merupakan salah satu penyakit yang mematikan bagi yang mengidapnya. Penyakit ini disebabkan oleh beberapa factor diantaranya pola makan hidup yang tidak teratur atau berlebihan. Apabila penyakit ini tidak dihentikan, maka penderita penyakit Diabetes Mellitus akan semakin memakan para pasien penderita penyakit ini. Menurut WHO atau World Health Organization, sekitar 425 juta orang menderita penyakit diabetes, kemudian 1,6 juta kematian setiap tahunnya di akibatkan oleh penyakit diabetes. Kemudian, pada tahun 2016 di Indonesia, kematian yang disebabkan oleh penyakit diabetes sekitar 99 ribu jiwa. Penyakit diabetes pada tahun ke tahun semakin meningkat, jadi perlu adanya sebuah sistem yang dapat membantu medis untuk melakukan klasifikasi terhadap diabetes berdasarkan data kesehatan pasien. Salah satu metode yang dapat digunakan untuk memprediksi penyakit diabetes mellitus adalah dengan menggunakan data mining. Data mining merupakan suatu proses yang interaktif untuk memprediksi penyakit diabetes mellitus. Prediksi untuk mendiagnosis penyakit ini menggunakan seleksi fitur berbasis Particle Swarm Optimization (PSO) pada dataset Kaggle.com. Dan metode klasifikasi yang digunakan yaitu metode Decision Tree dan K-Nearest Neighbors (K-NN). Hasil dari penelitian ini menghasilkan nilai akurasi tertinggi sebanyak 79.8% dengan AUC 0.71 dengan menggunakan metode Decision Tree, dan untuk menggunakan optimasi metode K-Nearest Neighbors (K-NN) menggunakan Particle Swarm Optimization (PSO) memiliki nilai akurasi tertinggi sebanyak 77.09%.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
基于粒子群优化算法的决策树和K-近邻算法在糖尿病预测精度分析中的应用
糖尿病是一种非传染性疾病,但对糖尿病患者来说却是致命的疾病之一。这种疾病是由一些因素引起的,其中生活模式不规律或过度。如果这种疾病不停止,那么糖尿病患者会吃更多的这些患者。根据世界卫生组织或世界卫生组织的数据,约有4.25亿人患有糖尿病,每年有160万人死于糖尿病。2016年,在印度尼西亚,糖尿病导致的死亡人数约为99000人。糖尿病正在逐年增长,因此需要一个系统来帮助医生根据患者健康数据对糖尿病进行分类。一种可用于预测糖尿病的方法是使用挖掘数据。挖掘数据是预测糖尿病的一个交互式过程。诊断该疾病的预测使用粒子群优化(PSO)在Kaggle.com数据集上的特征选择。使用的分类方法是决策树和K-最近邻(K-NN)方法。本研究的结果使用决策树方法产生了79.8%的最大准确度值,AUC为0.71,使用粒子群优化(PSO)优化K-最近邻方法(K-NN)的最大准确率值为77.09%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
40
审稿时长
4 weeks
期刊最新文献
Implementation of the Multimedia Development Life Cycle in Making Educational Games About Indonesia Data Mining Algorithm Decision Tree Itterative Dechotomiser 3 (ID3) for Classification of Stroke Implementation of Weight Aggregated Sum Product Assessment (WASPAS) on the Selection of Online English Course Platforms Usability of Brain Tumor Detection Using the DNN (Deep Neural Network) Method Based on Medical Image on DICOM Performance Comparison Analysis of Multi Prime RSA and Multi Power RSA
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1