Pengaruh Stopword Terhadap Performa Klasifikasi Tweet Berbahasa Indonesia

A. Hidayatullah
{"title":"Pengaruh Stopword Terhadap Performa Klasifikasi Tweet Berbahasa Indonesia","authors":"A. Hidayatullah","doi":"10.14421/jiska.2016.11-01","DOIUrl":null,"url":null,"abstract":"Data tweet telah banyak dimanfaatkan dalam penelitian di bidang text mining. Salah satu diantaranya adalah dalam klasifikasi teks. Namun, sebagian besar data tweet merupakan data yang masih kotor dan mengandung banyak noise di dalamnya. Oleh karena itu, pemrosesan awal terhadap tweet sangat penting untuk dilakukan. Salah satu metode pemrosesan awal yang dilakukan untuk mereduksi noise dalam tweet adalah stopword removal. Lebih lanjut penelitian ini akan melakukan perbandingan hasil akurasi antara pemrosesan awal yang melibatkan proses penghapusan stopword dengan permosesan awal yang tanpa melibatkan stopword removal. Hal ini dilakukan untuk mengetahui signifikansi tahapan stopword removal dalam klasifikasi teks berbahasa Indonesia. Dalam penelitian ini, dilakukan dua model pemrosesan awal dimana salah satu proses melibatkan stopword removal dan proses yang lainnya tanpa melakukan stopword removal. Hasil eksperimen menunjukkan bahwa melakukan penghapusan stopword dalam pre-processing mampu meningkatkan performa klasifikasi yang dibuktikan dengan adanya peningkatan akurasi. Kata Kunci : Stopword removal, pre-processing, klasifikasi teks, klasifikasi tweet","PeriodicalId":34216,"journal":{"name":"JISKA Jurnal Informatika Sunan Kalijaga","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2016-05-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JISKA Jurnal Informatika Sunan Kalijaga","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.14421/jiska.2016.11-01","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Data tweet telah banyak dimanfaatkan dalam penelitian di bidang text mining. Salah satu diantaranya adalah dalam klasifikasi teks. Namun, sebagian besar data tweet merupakan data yang masih kotor dan mengandung banyak noise di dalamnya. Oleh karena itu, pemrosesan awal terhadap tweet sangat penting untuk dilakukan. Salah satu metode pemrosesan awal yang dilakukan untuk mereduksi noise dalam tweet adalah stopword removal. Lebih lanjut penelitian ini akan melakukan perbandingan hasil akurasi antara pemrosesan awal yang melibatkan proses penghapusan stopword dengan permosesan awal yang tanpa melibatkan stopword removal. Hal ini dilakukan untuk mengetahui signifikansi tahapan stopword removal dalam klasifikasi teks berbahasa Indonesia. Dalam penelitian ini, dilakukan dua model pemrosesan awal dimana salah satu proses melibatkan stopword removal dan proses yang lainnya tanpa melakukan stopword removal. Hasil eksperimen menunjukkan bahwa melakukan penghapusan stopword dalam pre-processing mampu meningkatkan performa klasifikasi yang dibuktikan dengan adanya peningkatan akurasi. Kata Kunci : Stopword removal, pre-processing, klasifikasi teks, klasifikasi tweet
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Stopword即将推出的印尼语推文分类性能
推特数据在文本挖掘领域的研究中得到了广泛的应用。其中之一是文本分类。然而,大多数推特数据仍然是肮脏的,并包含大量的噪音。因此,早期处理twitter是非常重要的。早期修复声音的方法之一是删除jar。进一步的研究将对初始处理进行一个精确的比较,该处理涉及删除秒表和初始进行进行,而不涉及删除秒表。这是为了找出在印尼语文本分类中删除jar序列的意义。在这项研究中,有两种早期的处理模式,其中一种涉及到删除电容器,另一种则不进行removal。实验结果表明,在预处理过程中去除电瓶可以通过增加准确度来证明分级性能。关键词:终端删除,预处理,文本分类,分类推文
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
21
审稿时长
12 weeks
期刊最新文献
Pemodelan Proses Bisnis Kuliah Online MOOCs menggunakan BPMN (Studi Kasus alison.com) Analisis Bibliometrik Publikasi Isu Kebocoran Data Menggunakan VOSviewer Klasifikasi Sentimen Masyarakat Terhadap Proses Pemindahan Ibu Kota Negara (IKN) Indonesia pada Media Sosial Twitter Menggunakan Metode Naïve Bayes Klasifikasi Tingkat Kerusakan Sektor Pasca Bencana Alam Menggunakan Metode MULTIMOORA Berbasis Web Pembuatan Ergonomic Mechanical Keyboard untuk Mengurangi Cidera Tangan Menggunakan Teknologi Arduino
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1