Reduksi Dimensi Data menggunakan Metode Wrapper Sequential Feature Selection untuk Peningkatan Performa Algoritma Naïve Bayes terhadap Dataset Medis

Mochammad Yusa, Funny Farady Coastera, Muhammad Randa Yandika
{"title":"Reduksi Dimensi Data menggunakan Metode Wrapper Sequential Feature Selection untuk Peningkatan Performa Algoritma Naïve Bayes terhadap Dataset Medis","authors":"Mochammad Yusa, Funny Farady Coastera, Muhammad Randa Yandika","doi":"10.26418/jp.v8i2.54328","DOIUrl":null,"url":null,"abstract":"Penggunaan Machine Learning sebagai alat bantu dalam penanganan medis saat ini berkembang dengan pesat. Salah satu penyakit medis yang dikembangkan menggukan algoritma komputasi adalah Cardiovascullar Disease (CVD). Machine learning model yang diterapkan didasarkan dataset rekam medis. Tujuan penelitian ini adalah menginvestigasi performa algoritma naïve bayes dengan menerpakan metode Wrapper Sequential Feature Selection (WSFS). Metode penelitian dimulai dari pengumpulan dataset, data preprocessing, penerapan model Naïve Bayes, dan atribut scoring menggunakan Wrapper SFS, dan validasi performa menggunakan uji validasi 10-Fold Cross-Validation. Data history yang digunakan yaitu dataset Heart Failure Clinical Records yang terdiri dari 299 instances pada 13 features. Hasil penelitian menunjukkan bahwa metode Wrapper SFS dapat mengimprovisasi nilai performa Algoritma Naïve Bayes dari nilai akurasi, Precisi, dan Recall. Adapun kenaikan performa didapatkan dengan kombinasi 6 fitur ('anaemia', 'diabetes', 'ejection_fraction', 'serum_creatinine', 'gender', 'time') yang didapatkan dari seleksi fitur WSFS terhadap Algoritma tersebut yaitu nilai akurasi meningkat sebanyak 6,334%, skor recall meningkat 11,333%, dan nilai precision meningkat sebesar 20,07% dibandingkan dengan Algoritma Naïve Bayes.   ","PeriodicalId":31793,"journal":{"name":"JEPIN Jurnal Edukasi dan Penelitian Informatika","volume":"36 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2022-08-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JEPIN Jurnal Edukasi dan Penelitian Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26418/jp.v8i2.54328","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Penggunaan Machine Learning sebagai alat bantu dalam penanganan medis saat ini berkembang dengan pesat. Salah satu penyakit medis yang dikembangkan menggukan algoritma komputasi adalah Cardiovascullar Disease (CVD). Machine learning model yang diterapkan didasarkan dataset rekam medis. Tujuan penelitian ini adalah menginvestigasi performa algoritma naïve bayes dengan menerpakan metode Wrapper Sequential Feature Selection (WSFS). Metode penelitian dimulai dari pengumpulan dataset, data preprocessing, penerapan model Naïve Bayes, dan atribut scoring menggunakan Wrapper SFS, dan validasi performa menggunakan uji validasi 10-Fold Cross-Validation. Data history yang digunakan yaitu dataset Heart Failure Clinical Records yang terdiri dari 299 instances pada 13 features. Hasil penelitian menunjukkan bahwa metode Wrapper SFS dapat mengimprovisasi nilai performa Algoritma Naïve Bayes dari nilai akurasi, Precisi, dan Recall. Adapun kenaikan performa didapatkan dengan kombinasi 6 fitur ('anaemia', 'diabetes', 'ejection_fraction', 'serum_creatinine', 'gender', 'time') yang didapatkan dari seleksi fitur WSFS terhadap Algoritma tersebut yaitu nilai akurasi meningkat sebanyak 6,334%, skor recall meningkat 11,333%, dan nilai precision meningkat sebesar 20,07% dibandingkan dengan Algoritma Naïve Bayes.   
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
数据维度还原方法使用wrap Sequential Feature选择性方法来提高医学数据分析算法的Naive Bayes性能
在医疗护理中使用学习机器是一个辅助工具,目前正在蓬勃发展。最先进的医疗疾病之一是心血管疾病(CVD)。应用于医学记录数据的学习机器模型。本研究的目的是通过输入wrap序列特征选择(WSFS)来调查naive bayes算法的性能。研究方法从数据收集、分析数据、模型Naive Bayes的应用、使用wlat SFS进行评分,以及使用10折交叉验证验证成绩。历史数据是调查心脏Failure临床记录,由13个特征中的299个机构组成。研究表明,w说唱SFS方法可以即兴发挥算法准确度、精确度和召回值的天真率。至于性能的增加,可以通过将WSFS特性选择与该算法一起获得的6种特性(“阿纳米亚”、“糖尿病”、“分泌解析”、“血清_fraction”、“serum_creatinine”、“性别”、“时间”)组合而成,这一算法的准确性值增加了6.334%,召回分数增加了11.333%,而precision值与Naive Bayes算法相比增加了207%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
1
审稿时长
10 weeks
期刊最新文献
Optimasi Hyperparameter pada Neural Network (Studi Kasus: Identifikasi Komentar Cyberbullying Instagram) Algoritma Penanganan Constraint pada Persoalan Penjadwalan Perkuliahan Universitas di Lingkungan Pendidikan Tinggi Keagamaan Islam (PTKI) Sistem Penilaian Jawaban Singkat Otomatis pada Ujian Online Berbasis Komputer Menggunakan Algoritma Cosine Similarity Penerapan Seleksi Fitur Particle Swarm Optimization pada Klasifikasi Teks (Studi Kasus: Komentar Cyberbullying Instagram) Sistem Rekomendasi Topik Skripsi Program Studi Informatika
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1