Deteksi Transaksi Fraud Kartu Kredit Menggunakan Oversampling ADASYN dan Seleksi Fitur SVM-RFECV

Wayan Dharmana, I. Gede, Aris Gunadi, Luh Joni Erawati, Dewi
{"title":"Deteksi Transaksi Fraud Kartu Kredit Menggunakan Oversampling ADASYN dan Seleksi Fitur SVM-RFECV","authors":"Wayan Dharmana, I. Gede, Aris Gunadi, Luh Joni Erawati, Dewi","doi":"10.25126/jtiik.20241117640","DOIUrl":null,"url":null,"abstract":"Perkembangan kejahatan transaksi fraud kartu kredit memberikan dampak kerugian finansial bagi pemegang kartu. Pengembangan model deteksi transaksi fraud menggunakan machine learning telah dilakukan, namun memiliki beberapa tantangan meliputi ketidakseimbangan data serta dimensi dataset yang besar. Penelitian ini mengusulkan pendekatan pengembangan dengan seleksi fitur menggunakan SVM-RFECV dan metode oversampling dengan ADASYN. Pendekatan ini diharapkan mampu mengatasi permasalahan dimensi data serta ketidakseimbangan data yang terjadi. Seleksi fitur dengan SVM-RFECV menghasilkan variabel optimal pada rasio data latih 70% sejumlah 390 variabel, rasio data latih 80% sejumlah 400 variabel dan rasio data latih 90% sejumlah 390 variabel. Metode ADASYN telah memperbaiki ketidakseimbangan data dengan menghasilkan data sintetis berdasarkan rasio oversampling meliputi 100%, 50% dan 25%. Model yang menggunakan data hasil oversampling mengalami peningkatan kinerja AUC dan recall. Kinerja AUC tertinggi dihasilkan sejumlah 88,08% pada data latih 70%, oversampling 100% dan algoritma LGBM. Sedangkan, kinerja recall tertinggi sejumlah 83,08% dihasilkan saat menggunakan data latih 70%, oversampling 100% dengan algoritma AdaBoost. Berdasarkan pembahasan ini, maka dapat disimpulkan bahwa penggunaan oversampling dengan ADASYN dan seleksi fitur SVM-RFECV dapat dipertimbangkan untuk meningkatkan kinerja AUC dan recall.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"26 6","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-02-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.20241117640","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Perkembangan kejahatan transaksi fraud kartu kredit memberikan dampak kerugian finansial bagi pemegang kartu. Pengembangan model deteksi transaksi fraud menggunakan machine learning telah dilakukan, namun memiliki beberapa tantangan meliputi ketidakseimbangan data serta dimensi dataset yang besar. Penelitian ini mengusulkan pendekatan pengembangan dengan seleksi fitur menggunakan SVM-RFECV dan metode oversampling dengan ADASYN. Pendekatan ini diharapkan mampu mengatasi permasalahan dimensi data serta ketidakseimbangan data yang terjadi. Seleksi fitur dengan SVM-RFECV menghasilkan variabel optimal pada rasio data latih 70% sejumlah 390 variabel, rasio data latih 80% sejumlah 400 variabel dan rasio data latih 90% sejumlah 390 variabel. Metode ADASYN telah memperbaiki ketidakseimbangan data dengan menghasilkan data sintetis berdasarkan rasio oversampling meliputi 100%, 50% dan 25%. Model yang menggunakan data hasil oversampling mengalami peningkatan kinerja AUC dan recall. Kinerja AUC tertinggi dihasilkan sejumlah 88,08% pada data latih 70%, oversampling 100% dan algoritma LGBM. Sedangkan, kinerja recall tertinggi sejumlah 83,08% dihasilkan saat menggunakan data latih 70%, oversampling 100% dengan algoritma AdaBoost. Berdasarkan pembahasan ini, maka dapat disimpulkan bahwa penggunaan oversampling dengan ADASYN dan seleksi fitur SVM-RFECV dapat dipertimbangkan untuk meningkatkan kinerja AUC dan recall.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
利用 ADASYN 过度采样和 SVM-RFECV 特征选择检测信用卡欺诈交易
信用卡欺诈交易的发展给持卡人造成了经济损失。利用机器学习开发欺诈交易检测模型的工作已经开展,但面临着数据不平衡和数据集维度大等挑战。本研究提出了一种利用 SVM-RFECV 和 ADASYN 超采样方法进行特征选择的开发方法。这种方法有望克服数据维度和数据不平衡的问题。使用 SVM-RFECV 进行特征选择时,在 390 个变量的 70% 训练数据比率、400 个变量的 80% 训练数据比率和 390 个变量的 90% 训练数据比率下产生了最佳变量。ADASYN 方法根据 100%、50% 和 25% 的超采样率生成合成数据,纠正了数据不平衡问题。使用超采样数据的模型的 AUC 和召回率都有所提高。在 70% 的训练数据、100% 的超采样和 LGBM 算法上,AUC 性能最高,达到 88.08%。同时,在使用 70% 的训练数据、100% 的超采样和 AdaBoost 算法时,召回率最高,达到 83.08%。基于以上讨论,可以得出结论:可以考虑使用 ADASYN 和 SVM-RFECV 特征选择进行超采样,以提高 AUC 和召回性能。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
16 weeks
期刊最新文献
Schedule Cat Feeder Berbasis Internet of Things Menggunakan Wemos D1 Mini dan Telegram Preprocessing Data dan Klasifikasi untuk Prediksi Kinerja Akademik Siswa Peningkatan Performa Pengenalan Wajah pada Gambar Low-Resolution Menggunakan Metode Super-Resolution Analisis Sentimen Ulasan Rumah Makan Menggunakan Perbandingan Algoritma Support Vector Machine dengan Naive bayes (Studi Kasus: Ayam Goreng Nelongso Cabang Singosari, Malang) Model Classifer Judul Berita Pariwisata Indonesia Berdasarkan Sentimen
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1