Penerapan Algoritma K-Nearest Neighbors untuk Klasifikasi Fragmen Metagenom Berdasarkan Ekstraksi Fitur K-Mers

Ryan Ananda Nolly, Amanda Fitria, Kana Saputra S
{"title":"Penerapan Algoritma K-Nearest Neighbors untuk Klasifikasi Fragmen Metagenom Berdasarkan Ekstraksi Fitur K-Mers","authors":"Ryan Ananda Nolly, Amanda Fitria, Kana Saputra S","doi":"10.30872/jim.v17i1.5779","DOIUrl":null,"url":null,"abstract":"Penelitian di bidang metagenomika menjadi salah satu bidang kajian bioinformatika yang terus berkembang. Metagenom merupakan sebuah teknik yang bertujuan untuk mengumpulkan gen-gen yang diambil secara langsung dari lingkungan dan mengenalisis informasi genetika di dalamnya. Data yang diambil langsung dari lingkungan memungkinkan fragmen yang dihasilkan mengandung berbagai mikroorganisme, sehingga akan berakibat pada terjadinya kesalahan perakitan terhadap fragmen metagenom. Proses binning (pengelompokan) dapat dilakukan dengan dua pendekatan, yaitu pendekatan homologi dan pendekatan komposisi. Pendekatan secara komposisi tidak perlu membandingkan dan menyimpulkan setiap hasil pencarian pada setiap level taksonomi sehingga waktu yang diperlukan untuk pengelompokan lebih cepat dibandingkan dengan pendekatan secara homologi.Pada proses binning (pengelompokan) dengan pendekatan komposisi, teknik yang dilakukan adalah dengan supervised learning. Tujuan dari penelitian ini adalah untuk mengklasifikasi fragmen metagenom menggunakan algoritma KNN dan K-Mers sebagai ekstraksi fitur. Selain itu, untuk menghitung tingkat akurasi klasifikasi fragmen metagenom menggunakan confusion matrix. Metode K-Mers yang digunakan sebagai ekstraksi fitur bertujuan untuk mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan, sehingga perhitungan untuk mencari tingkat akurasi menjadi lebih mudah didapatkan. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa semakin rendah nilai K yang digunakanpada KNN maka semakin tinggi akurasi yang diperoleh. Pada pengujian ini diperoleh perhitungan akurasi sebesar 94,37% dimana nilai K untuk KNN adalah 3 dan nilai K untuk K-Mers adalah 3. Hasil klasifikasi fragmen metagenom menggunakan algoritma KNN berdasarkan ekstraksi fitur K-Mers dapat dilakukan dengan baik.","PeriodicalId":149284,"journal":{"name":"Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-07-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Informatika Mulawarman : Jurnal Ilmiah Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30872/jim.v17i1.5779","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Penelitian di bidang metagenomika menjadi salah satu bidang kajian bioinformatika yang terus berkembang. Metagenom merupakan sebuah teknik yang bertujuan untuk mengumpulkan gen-gen yang diambil secara langsung dari lingkungan dan mengenalisis informasi genetika di dalamnya. Data yang diambil langsung dari lingkungan memungkinkan fragmen yang dihasilkan mengandung berbagai mikroorganisme, sehingga akan berakibat pada terjadinya kesalahan perakitan terhadap fragmen metagenom. Proses binning (pengelompokan) dapat dilakukan dengan dua pendekatan, yaitu pendekatan homologi dan pendekatan komposisi. Pendekatan secara komposisi tidak perlu membandingkan dan menyimpulkan setiap hasil pencarian pada setiap level taksonomi sehingga waktu yang diperlukan untuk pengelompokan lebih cepat dibandingkan dengan pendekatan secara homologi.Pada proses binning (pengelompokan) dengan pendekatan komposisi, teknik yang dilakukan adalah dengan supervised learning. Tujuan dari penelitian ini adalah untuk mengklasifikasi fragmen metagenom menggunakan algoritma KNN dan K-Mers sebagai ekstraksi fitur. Selain itu, untuk menghitung tingkat akurasi klasifikasi fragmen metagenom menggunakan confusion matrix. Metode K-Mers yang digunakan sebagai ekstraksi fitur bertujuan untuk mempartisi data dan membentuk satu atau lebih kelompok yang memiliki kesamaan, sehingga perhitungan untuk mencari tingkat akurasi menjadi lebih mudah didapatkan. Berdasarkan hasil pengujian yang dilakukan menunjukkan bahwa semakin rendah nilai K yang digunakanpada KNN maka semakin tinggi akurasi yang diperoleh. Pada pengujian ini diperoleh perhitungan akurasi sebesar 94,37% dimana nilai K untuk KNN adalah 3 dan nilai K untuk K-Mers adalah 3. Hasil klasifikasi fragmen metagenom menggunakan algoritma KNN berdasarkan ekstraksi fitur K-Mers dapat dilakukan dengan baik.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
元基因组学的研究成为生物信息学不断发展的领域之一。元基因组是一种收集直接从环境中提取的基因并分析其遗传信息的技术。直接从环境中提取的数据允许生成的碎片含有多种微生物,从而导致对元基因组碎片的组装出错。捆绑方法可以通过两种方法来完成,即同质方法和合成方法。合成方法不需要比较和在每个分类学水平上对每个搜索结果进行总结,这样分组所需要的时间就比同源方法快得多。在合成方法的集合过程中,所做的工程是通过超活化学习。这项研究的目的是利用KNN和K-Mers的算法对元基因组碎片进行分类。此外,用混乱矩阵来计算元基因组碎片分类的准确性水平。K-Mers的提取方法旨在划分数据并形成一个或多个具有相似之处的群体,从而使计算更容易获得准确率。根据所做的测试结果,KNN的K值越低,准确率就越高。在此测试中,KNN的K值是3,K- mers的K值是3。使用KNN提取K-Mers特征的算法对元基因组碎片进行分类的结果是可以很好地做到的。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Analisis Efisiensi Metode K-Nearest Neighbor dan Forward Chaining Untuk Prediksi Stunting Pada Balita Analisis Perubahan Tutupan Lahan Menggunakan Metode Klasifikasi Terbimbing Pada Data Citra Penginderaan Jauh Kota Samarinda-Kalimantan Timur Perancangan Model Animasi 3D Transportasi Air Pada Sungai Karang Mumus Sistem Pelayanan Pasien Berbasis Website di Puskesmas Gayam Sumenep Modifikasi Metode Fuzzy C-Means untuk Klasifikasi Citra Daun Padi
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1