Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa
{"title":"使用TF-IDF破解算法和COSINE相似,研究程序活动的新闻信息恢复","authors":"Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa","doi":"10.33005/sitasi.v2i1.309","DOIUrl":null,"url":null,"abstract":"Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.","PeriodicalId":326660,"journal":{"name":"Prosiding Seminar Nasional Teknologi dan Sistem Informasi","volume":"33 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-09-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"TEMU KEMBALI INFORMASI BERITA KEGIATAN PROGRAM STUDI MENGGUNAKAN ALGORITMA PEMBOBOTAN TF-IDF DAN COSINE SIMILARITY\",\"authors\":\"Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa\",\"doi\":\"10.33005/sitasi.v2i1.309\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.\",\"PeriodicalId\":326660,\"journal\":{\"name\":\"Prosiding Seminar Nasional Teknologi dan Sistem Informasi\",\"volume\":\"33 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-09-18\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Prosiding Seminar Nasional Teknologi dan Sistem Informasi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.33005/sitasi.v2i1.309\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Prosiding Seminar Nasional Teknologi dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33005/sitasi.v2i1.309","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
TEMU KEMBALI INFORMASI BERITA KEGIATAN PROGRAM STUDI MENGGUNAKAN ALGORITMA PEMBOBOTAN TF-IDF DAN COSINE SIMILARITY
Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.