Rizki Anom Raharjo, I. M. G. Sunarya, D. G. H. Divayana
{"title":"Perbandingan Metode Naïve Bayes Classifier Dan Support Vector Machine Pada Kasus Analisis Sentimen Terhadap Data Vaksin Covid-19 Di Twitter","authors":"Rizki Anom Raharjo, I. M. G. Sunarya, D. G. H. Divayana","doi":"10.51903/elkom.v15i2.918","DOIUrl":null,"url":null,"abstract":"Organisasi Kesehatan Dunia (WHO) secara resmi menyebut virus Covid-19 sebagai pandemi global, oleh karena itu semua negara di dunia berusaha meminimalkan dampak yang ditimbulkan oleh virus tersebut, yaitu dengan mengembangkan vaksin. Dalam konteks pandemi Covid-19, pemerintah Indonesia juga meminta dan mendorong masyarakat untuk turut serta mendukung vaksinasi, namun upaya tersebut sebenarnya memiliki kelebihan dan kekurangan, sehingga banyak masyarakat yang mengutarakan pendapatnya di jejaring sosial salah satunya Twitter. Penelitian ini bertujuan untuk mengetahui hasil penerapan analisis sentimen dan mengukur performansi algoritma Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) terhadap data vaksin Covid-19 dengan cara mengklasifikasikan data tersebut ke dalam kelas positif dan negatif. Data tweet yang didapat kemudian dilakukan text preprocessing untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan text preprocessing antara lain Case Folding, Tokenizing, Filtering, dan Stemming. Penelitian ini mengkaji kinerja Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Kemudian melakukan splitting data yaitu membagi data training 80% dan data testing 20% dengan harapan mendapatkan model dengan performansi terbaik dan yang terakhir melakukan visualisasi data tweet dengan menggunakan Word Cloud agar bisa menarik sebuah kesimpulan. Hasil klasifikasi data tweet vaksin Covid-19 menggunakan algoritma Naïve Bayes Classifier mendapatkan nilai accuracy sebesar 81%, precision sebesar 80%, recall sebesar 99%, dan f1-score sebesar 89%, Sedangkan untuk algoritma Support Vector Machine mendapatkan nilai accuracy sebesar 87%, precision sebesar 88%, recall sebesar 96%, dan f1-score sebesar 92%.","PeriodicalId":118486,"journal":{"name":"Elkom : Jurnal Elektronika dan Komputer","volume":"93 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Elkom : Jurnal Elektronika dan Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.51903/elkom.v15i2.918","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3
Abstract
Organisasi Kesehatan Dunia (WHO) secara resmi menyebut virus Covid-19 sebagai pandemi global, oleh karena itu semua negara di dunia berusaha meminimalkan dampak yang ditimbulkan oleh virus tersebut, yaitu dengan mengembangkan vaksin. Dalam konteks pandemi Covid-19, pemerintah Indonesia juga meminta dan mendorong masyarakat untuk turut serta mendukung vaksinasi, namun upaya tersebut sebenarnya memiliki kelebihan dan kekurangan, sehingga banyak masyarakat yang mengutarakan pendapatnya di jejaring sosial salah satunya Twitter. Penelitian ini bertujuan untuk mengetahui hasil penerapan analisis sentimen dan mengukur performansi algoritma Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) terhadap data vaksin Covid-19 dengan cara mengklasifikasikan data tersebut ke dalam kelas positif dan negatif. Data tweet yang didapat kemudian dilakukan text preprocessing untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan text preprocessing antara lain Case Folding, Tokenizing, Filtering, dan Stemming. Penelitian ini mengkaji kinerja Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Kemudian melakukan splitting data yaitu membagi data training 80% dan data testing 20% dengan harapan mendapatkan model dengan performansi terbaik dan yang terakhir melakukan visualisasi data tweet dengan menggunakan Word Cloud agar bisa menarik sebuah kesimpulan. Hasil klasifikasi data tweet vaksin Covid-19 menggunakan algoritma Naïve Bayes Classifier mendapatkan nilai accuracy sebesar 81%, precision sebesar 80%, recall sebesar 99%, dan f1-score sebesar 89%, Sedangkan untuk algoritma Support Vector Machine mendapatkan nilai accuracy sebesar 87%, precision sebesar 88%, recall sebesar 96%, dan f1-score sebesar 92%.