{"title":"Temu Kembali Informasi Menggunakan Metode Vector Space Model Pada Majalah Suara Muhammadiyah Periode 2010 – 2015","authors":"Adi Sucipto","doi":"10.23917/EMITOR.V21I2.13672","DOIUrl":null,"url":null,"abstract":"Temu kembali informasi berdasar peristiwa pada Majalah Suara Muhammadiyah periode 2010 – 2015 adalah untuk melihat banyaknya kata yang digunakan pada dokumen untuk menggambarkan topik yang dibahas pada dokumen tersebut. Temu kembali infomasi pada dokumen ini dibatasi untuk periode 2010 – 2015 dan dokumen yang dikumpulkan sebanyak 232 dokumen. Pengumpulan dokumen majalah Suara Muhammadiyah dalam bentuk digital yaitu berekstensi pdf. Ektraksi teks dokumen dari berkas pdf menggunakan pdfminer. Metode untuk temu kembali menggunakan Vector Space Model. Tahapan dimulai dari ekstraksi dokumen pdf menjadi teks,kemudian teks diparsing untuk menghapus tanda baca dan tanda hubung, penghapusan stopwords bahasa Indonesia untuk mengurangi kata-kata hubung dan kata-kata yang kurang bermakna, kemudian dilakukan pembobotan teks dan pencarian kemiripan teks untuk dapat menghitung dan mencari kembali informasi. Setelah dilakukan parsing dan pembobotan teks didapatkan bahwa teks yang banyak digunakan di dalam dokumen tersebut. Dengan hasil Precision sebesar 72.96% dan F1 measure sebesar 80.94. Sehingga artikel yang dapat ditemukan dengan kata kunci tertentu yang sesuai.","PeriodicalId":431304,"journal":{"name":"Emitor: Jurnal Teknik Elektro","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-08-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Emitor: Jurnal Teknik Elektro","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.23917/EMITOR.V21I2.13672","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Temu kembali informasi berdasar peristiwa pada Majalah Suara Muhammadiyah periode 2010 – 2015 adalah untuk melihat banyaknya kata yang digunakan pada dokumen untuk menggambarkan topik yang dibahas pada dokumen tersebut. Temu kembali infomasi pada dokumen ini dibatasi untuk periode 2010 – 2015 dan dokumen yang dikumpulkan sebanyak 232 dokumen. Pengumpulan dokumen majalah Suara Muhammadiyah dalam bentuk digital yaitu berekstensi pdf. Ektraksi teks dokumen dari berkas pdf menggunakan pdfminer. Metode untuk temu kembali menggunakan Vector Space Model. Tahapan dimulai dari ekstraksi dokumen pdf menjadi teks,kemudian teks diparsing untuk menghapus tanda baca dan tanda hubung, penghapusan stopwords bahasa Indonesia untuk mengurangi kata-kata hubung dan kata-kata yang kurang bermakna, kemudian dilakukan pembobotan teks dan pencarian kemiripan teks untuk dapat menghitung dan mencari kembali informasi. Setelah dilakukan parsing dan pembobotan teks didapatkan bahwa teks yang banyak digunakan di dalam dokumen tersebut. Dengan hasil Precision sebesar 72.96% dan F1 measure sebesar 80.94. Sehingga artikel yang dapat ditemukan dengan kata kunci tertentu yang sesuai.