{"title":"基于算法支持向量机和K-最近邻的词嵌入对新冠肺炎处理推文的情感分析","authors":"Trifebi Shina Sabrila, V. R. Sari, A. E. Minarno","doi":"10.21111/FIJ.V6I2.5536","DOIUrl":null,"url":null,"abstract":"Analisis sentimen merupakan salah satu bidang dari pengolahan data berbentuk teks untuk mengidentifikasi isi yang terkandung dalam teks pada dataset dengan membagi dataset ke dalam dua kelas yaitu sentimen positif dan sentimen negatif. Pada penelitian ini akan dilakukan analisis sentimen terhadap data yang diperoleh dari jejaring sosial Twitter mengenai penanganan Covid-19 oleh pemerintah di Indonesia yang menuai banyak pro dan kontra oleh masyarakat di Indonesia. Tujuan dari penelitian ini adalah untuk mengetahui kecenderungan masyarakat terkait topik tersebut. Metode klasifikasi yang digunakan dalam penelitian ini adalah Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) dengan ekstraksi fitur Word Embedding. Pengklasifikasian yang dilakukan dengan menggunakan algoritma Support Vector Machine (SVM) dengan menggunakan ekstraksi fitur Word Embedding yaitu Word2Vec menghasilkan akurasi sebesar 85%, presisi 86% , recall 85%, dan nilai AUC sebesar 0.92. Sementara pada algoritma K-Nearst Neighbor (KNN) dengan ekstraksi fitur yang sama, dihasilkan akurasi sebesar 76%, presisi 77%, recall 76% dan nilai AUC sebesar 0.87. Hasil perbandingan dari kedua metode menunjukkan bahwa algoritma Support Vector Machine (SVM) mendapatkan performa yang lebih baik dibandingkan algoritma K-Nearest Neighbor (KNN).","PeriodicalId":33722,"journal":{"name":"Fountain of Informatics Journal","volume":"1 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-07-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"7","resultStr":"{\"title\":\"Analisis Sentimen Pada Tweet Tentang Penanganan Covid-19 Menggunakan Word Embedding Pada Algoritma Support Vector Machine Dan K-Nearest Neighbor\",\"authors\":\"Trifebi Shina Sabrila, V. R. Sari, A. E. Minarno\",\"doi\":\"10.21111/FIJ.V6I2.5536\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Analisis sentimen merupakan salah satu bidang dari pengolahan data berbentuk teks untuk mengidentifikasi isi yang terkandung dalam teks pada dataset dengan membagi dataset ke dalam dua kelas yaitu sentimen positif dan sentimen negatif. Pada penelitian ini akan dilakukan analisis sentimen terhadap data yang diperoleh dari jejaring sosial Twitter mengenai penanganan Covid-19 oleh pemerintah di Indonesia yang menuai banyak pro dan kontra oleh masyarakat di Indonesia. Tujuan dari penelitian ini adalah untuk mengetahui kecenderungan masyarakat terkait topik tersebut. Metode klasifikasi yang digunakan dalam penelitian ini adalah Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) dengan ekstraksi fitur Word Embedding. Pengklasifikasian yang dilakukan dengan menggunakan algoritma Support Vector Machine (SVM) dengan menggunakan ekstraksi fitur Word Embedding yaitu Word2Vec menghasilkan akurasi sebesar 85%, presisi 86% , recall 85%, dan nilai AUC sebesar 0.92. Sementara pada algoritma K-Nearst Neighbor (KNN) dengan ekstraksi fitur yang sama, dihasilkan akurasi sebesar 76%, presisi 77%, recall 76% dan nilai AUC sebesar 0.87. Hasil perbandingan dari kedua metode menunjukkan bahwa algoritma Support Vector Machine (SVM) mendapatkan performa yang lebih baik dibandingkan algoritma K-Nearest Neighbor (KNN).\",\"PeriodicalId\":33722,\"journal\":{\"name\":\"Fountain of Informatics Journal\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-07-25\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"7\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Fountain of Informatics Journal\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.21111/FIJ.V6I2.5536\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Fountain of Informatics Journal","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21111/FIJ.V6I2.5536","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Analisis Sentimen Pada Tweet Tentang Penanganan Covid-19 Menggunakan Word Embedding Pada Algoritma Support Vector Machine Dan K-Nearest Neighbor
Analisis sentimen merupakan salah satu bidang dari pengolahan data berbentuk teks untuk mengidentifikasi isi yang terkandung dalam teks pada dataset dengan membagi dataset ke dalam dua kelas yaitu sentimen positif dan sentimen negatif. Pada penelitian ini akan dilakukan analisis sentimen terhadap data yang diperoleh dari jejaring sosial Twitter mengenai penanganan Covid-19 oleh pemerintah di Indonesia yang menuai banyak pro dan kontra oleh masyarakat di Indonesia. Tujuan dari penelitian ini adalah untuk mengetahui kecenderungan masyarakat terkait topik tersebut. Metode klasifikasi yang digunakan dalam penelitian ini adalah Support Vector Machine (SVM) dan K-Nearest Neighbor (KNN) dengan ekstraksi fitur Word Embedding. Pengklasifikasian yang dilakukan dengan menggunakan algoritma Support Vector Machine (SVM) dengan menggunakan ekstraksi fitur Word Embedding yaitu Word2Vec menghasilkan akurasi sebesar 85%, presisi 86% , recall 85%, dan nilai AUC sebesar 0.92. Sementara pada algoritma K-Nearst Neighbor (KNN) dengan ekstraksi fitur yang sama, dihasilkan akurasi sebesar 76%, presisi 77%, recall 76% dan nilai AUC sebesar 0.87. Hasil perbandingan dari kedua metode menunjukkan bahwa algoritma Support Vector Machine (SVM) mendapatkan performa yang lebih baik dibandingkan algoritma K-Nearest Neighbor (KNN).