使用TF-IDF破解算法和COSINE相似,研究程序活动的新闻信息恢复

Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa
{"title":"使用TF-IDF破解算法和COSINE相似,研究程序活动的新闻信息恢复","authors":"Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa","doi":"10.33005/sitasi.v2i1.309","DOIUrl":null,"url":null,"abstract":"Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita  kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.","PeriodicalId":326660,"journal":{"name":"Prosiding Seminar Nasional Teknologi dan Sistem Informasi","volume":"33 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-09-18","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"TEMU KEMBALI INFORMASI BERITA KEGIATAN PROGRAM STUDI MENGGUNAKAN ALGORITMA PEMBOBOTAN TF-IDF DAN COSINE SIMILARITY\",\"authors\":\"Tresna Maulana Fahrudin, Muhammad Haris Hartanto, Alya Setya Paramita, Amanda Aulia, Rizqii Amaliyah Maulana, Iqbal Ramadhan Anniswa\",\"doi\":\"10.33005/sitasi.v2i1.309\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita  kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.\",\"PeriodicalId\":326660,\"journal\":{\"name\":\"Prosiding Seminar Nasional Teknologi dan Sistem Informasi\",\"volume\":\"33 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-09-18\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Prosiding Seminar Nasional Teknologi dan Sistem Informasi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.33005/sitasi.v2i1.309\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Prosiding Seminar Nasional Teknologi dan Sistem Informasi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33005/sitasi.v2i1.309","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

大多数信息以数字形式存储在电子媒体中,其中包括发布在官方网站上的节目研究活动的新闻内容。本研究计划的新闻内容可以是研讨会、工作坊/工作坊、客座讲座和其他由允许新闻内容不断增加的讲师和学生进行的三达玛活动。在用户需要的内容搜索或信息过程中,需要一个能够将信息以相关方式回溯到对文本文档进行搜索的系统。一种是对一份文件进行文字搜索,以确定一份文件的内容与另一份文件的内容有多相似。因此,本研究旨在设计信息集合原型系统,该系统可以使用TF-IDF破解算法和共生体算法进行研究程序的新闻内容搜索。本研究使用的文本文件来自东爪哇省“退伍军人”国家发展大学数据科学研究项目的官方网站,该项目的官方内容多达22个新闻内容。实验结果显示,10个查询使用不同的关键字,得到与计划活动新闻文件100%匹配的结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
TEMU KEMBALI INFORMASI BERITA KEGIATAN PROGRAM STUDI MENGGUNAKAN ALGORITMA PEMBOBOTAN TF-IDF DAN COSINE SIMILARITY
Sebagian besar informasi disimpan dalam wujud digital pada media elektronik, salah satunya konten berita kegiatan program studi yang dipublikasikan pada halaman website resmi. Konten berita kegiatan program studi ini dapat berupa kegiatan seminar, workshop/lokakarya, kuliah tamu, dan kegiatan Tridarma lainnya yang dilaksanakan oleh dosen dan mahasiswa yang memungkinkan jumlah konten berita yang terus bertambah. Dalam proses pencarian konten atau informasi yang dibutuhkan oleh pengguna dibutuhkan suatu sistem yang mampu menemu kembalikan informasi secara relevan untuk melakukan pencarian terhadap sekumpulan dokumen teks. Salah satunya dengan pencarian kata-kata pada dokumen yang digunakan untuk mengetahui seberapa mirip isi konten dari suatu dokumen dengan dokumen lainnya. Oleh karena itu, pada penelitian ini bertujuan untuk merancang prototype sistem temu kembali informasi yang dapat melakukan pencarian konten berita  kegiatan program studi menggunakan algoritma pembobotan TF-IDF dan Cosine Similarity. Dokumen teks yang digunakan dalam penelitian ini dikumpulkan dari konten berita kegiatan program studi yang diperoleh dari website resmi Program Studi Sains Data Universitas Pembangunan Nasional “Veteran” Jawa Timur yang berjumlah sebanyak 22 konten berita. Hasil percobaan menunjukkan bahwa 10 query menggunakan kata kunci yang berbeda mendapatkan hasil 100% kesesuaian dengan dokumen berita kegiatan Program Studi.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
INOVASI ZERO FOOD WASTE MELALUI APLIKASI DONASI DAN PENGOMPOSAN SISA MAKANAN BERLEBIH PERANCANGAN SISTEM E-PKK TERINTEGRASI WEBSITE DAN MOBILE (STUDI KASUS: TP-PKK KABUPATEN NGANJUK) PENGEMBANGAN APLIKASI E-PPID UNTUK DESA SIDOKARE, KABUPATEN NGANJUK: TRANSPARANSI INFORMASI PUBLIK PERANCANGAN SISTEM INFORMASI MANAJEMEN E- CLINICAL BERBASIS MOBILE PADA KLINIK X OPTIMALISASI PENGELOLAAN TRANSAKSI DENGAN MERANCANG APLIKASI E-PAYMENT UNTUK UMKM BASRENK.ID
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1