Rizki Anom Raharjo, I. M. G. Sunarya, D. G. H. Divayana
{"title":"在推特上对Covid-19疫苗数据的情感分析案例中,天真的Bayes Classifier和支持矢量机器的比较","authors":"Rizki Anom Raharjo, I. M. G. Sunarya, D. G. H. Divayana","doi":"10.51903/elkom.v15i2.918","DOIUrl":null,"url":null,"abstract":"Organisasi Kesehatan Dunia (WHO) secara resmi menyebut virus Covid-19 sebagai pandemi global, oleh karena itu semua negara di dunia berusaha meminimalkan dampak yang ditimbulkan oleh virus tersebut, yaitu dengan mengembangkan vaksin. Dalam konteks pandemi Covid-19, pemerintah Indonesia juga meminta dan mendorong masyarakat untuk turut serta mendukung vaksinasi, namun upaya tersebut sebenarnya memiliki kelebihan dan kekurangan, sehingga banyak masyarakat yang mengutarakan pendapatnya di jejaring sosial salah satunya Twitter. Penelitian ini bertujuan untuk mengetahui hasil penerapan analisis sentimen dan mengukur performansi algoritma Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) terhadap data vaksin Covid-19 dengan cara mengklasifikasikan data tersebut ke dalam kelas positif dan negatif. Data tweet yang didapat kemudian dilakukan text preprocessing untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan text preprocessing antara lain Case Folding, Tokenizing, Filtering, dan Stemming. Penelitian ini mengkaji kinerja Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Kemudian melakukan splitting data yaitu membagi data training 80% dan data testing 20% dengan harapan mendapatkan model dengan performansi terbaik dan yang terakhir melakukan visualisasi data tweet dengan menggunakan Word Cloud agar bisa menarik sebuah kesimpulan. Hasil klasifikasi data tweet vaksin Covid-19 menggunakan algoritma Naïve Bayes Classifier mendapatkan nilai accuracy sebesar 81%, precision sebesar 80%, recall sebesar 99%, dan f1-score sebesar 89%, Sedangkan untuk algoritma Support Vector Machine mendapatkan nilai accuracy sebesar 87%, precision sebesar 88%, recall sebesar 96%, dan f1-score sebesar 92%.","PeriodicalId":118486,"journal":{"name":"Elkom : Jurnal Elektronika dan Komputer","volume":"93 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-12-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":"{\"title\":\"Perbandingan Metode Naïve Bayes Classifier Dan Support Vector Machine Pada Kasus Analisis Sentimen Terhadap Data Vaksin Covid-19 Di Twitter\",\"authors\":\"Rizki Anom Raharjo, I. M. G. Sunarya, D. G. H. Divayana\",\"doi\":\"10.51903/elkom.v15i2.918\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Organisasi Kesehatan Dunia (WHO) secara resmi menyebut virus Covid-19 sebagai pandemi global, oleh karena itu semua negara di dunia berusaha meminimalkan dampak yang ditimbulkan oleh virus tersebut, yaitu dengan mengembangkan vaksin. Dalam konteks pandemi Covid-19, pemerintah Indonesia juga meminta dan mendorong masyarakat untuk turut serta mendukung vaksinasi, namun upaya tersebut sebenarnya memiliki kelebihan dan kekurangan, sehingga banyak masyarakat yang mengutarakan pendapatnya di jejaring sosial salah satunya Twitter. Penelitian ini bertujuan untuk mengetahui hasil penerapan analisis sentimen dan mengukur performansi algoritma Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) terhadap data vaksin Covid-19 dengan cara mengklasifikasikan data tersebut ke dalam kelas positif dan negatif. Data tweet yang didapat kemudian dilakukan text preprocessing untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan text preprocessing antara lain Case Folding, Tokenizing, Filtering, dan Stemming. Penelitian ini mengkaji kinerja Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Kemudian melakukan splitting data yaitu membagi data training 80% dan data testing 20% dengan harapan mendapatkan model dengan performansi terbaik dan yang terakhir melakukan visualisasi data tweet dengan menggunakan Word Cloud agar bisa menarik sebuah kesimpulan. Hasil klasifikasi data tweet vaksin Covid-19 menggunakan algoritma Naïve Bayes Classifier mendapatkan nilai accuracy sebesar 81%, precision sebesar 80%, recall sebesar 99%, dan f1-score sebesar 89%, Sedangkan untuk algoritma Support Vector Machine mendapatkan nilai accuracy sebesar 87%, precision sebesar 88%, recall sebesar 96%, dan f1-score sebesar 92%.\",\"PeriodicalId\":118486,\"journal\":{\"name\":\"Elkom : Jurnal Elektronika dan Komputer\",\"volume\":\"93 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-12-09\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"3\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Elkom : Jurnal Elektronika dan Komputer\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.51903/elkom.v15i2.918\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Elkom : Jurnal Elektronika dan Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.51903/elkom.v15i2.918","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Perbandingan Metode Naïve Bayes Classifier Dan Support Vector Machine Pada Kasus Analisis Sentimen Terhadap Data Vaksin Covid-19 Di Twitter
Organisasi Kesehatan Dunia (WHO) secara resmi menyebut virus Covid-19 sebagai pandemi global, oleh karena itu semua negara di dunia berusaha meminimalkan dampak yang ditimbulkan oleh virus tersebut, yaitu dengan mengembangkan vaksin. Dalam konteks pandemi Covid-19, pemerintah Indonesia juga meminta dan mendorong masyarakat untuk turut serta mendukung vaksinasi, namun upaya tersebut sebenarnya memiliki kelebihan dan kekurangan, sehingga banyak masyarakat yang mengutarakan pendapatnya di jejaring sosial salah satunya Twitter. Penelitian ini bertujuan untuk mengetahui hasil penerapan analisis sentimen dan mengukur performansi algoritma Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) terhadap data vaksin Covid-19 dengan cara mengklasifikasikan data tersebut ke dalam kelas positif dan negatif. Data tweet yang didapat kemudian dilakukan text preprocessing untuk mengoptimalkan pengolahan data. Terdapat 4 tahapan text preprocessing antara lain Case Folding, Tokenizing, Filtering, dan Stemming. Penelitian ini mengkaji kinerja Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM) dengan menambahkan teknik TF-IDF (Term Frequency-Inverse Document Frequency) yang bertujuan untuk memberikan bobot pada hubungan kata (term) sebuah dokumen. Kemudian melakukan splitting data yaitu membagi data training 80% dan data testing 20% dengan harapan mendapatkan model dengan performansi terbaik dan yang terakhir melakukan visualisasi data tweet dengan menggunakan Word Cloud agar bisa menarik sebuah kesimpulan. Hasil klasifikasi data tweet vaksin Covid-19 menggunakan algoritma Naïve Bayes Classifier mendapatkan nilai accuracy sebesar 81%, precision sebesar 80%, recall sebesar 99%, dan f1-score sebesar 89%, Sedangkan untuk algoritma Support Vector Machine mendapatkan nilai accuracy sebesar 87%, precision sebesar 88%, recall sebesar 96%, dan f1-score sebesar 92%.