COSINE算法的实现类似于检测标题主题的相似性

Heri Sutikno Sutikno
{"title":"COSINE算法的实现类似于检测标题主题的相似性","authors":"Heri Sutikno Sutikno","doi":"10.33365/jecsit.v1i1.6","DOIUrl":null,"url":null,"abstract":"Perkembangan judul penelitian tugas akhir saat ini menyediakan cara yang mudah untuk mencari literatur akademis secara luas. Seseorang dapat mencari di seluruh bidang ilmu dan referensi. Dalam menentukan diterima atau tidaknya sebuah judul skripsi maka yang dilakukan adalah dengan membandingkan judul tersebut judul yang lain secara manual. Tentu saja hal ini akan membutuhkan waktu yang cukup lama. Oleh karena itu, diperlukan suatu sistem yang mampu mendeteksi persentase kemiripan judul secara cepat dan tepat. Tujuan penelitian yaitu membentuk suatu system yang membantu dalam membandingkan beberapa tugas akhir. Dalam sistem ini judul di input kedalam sebuah sistem kemudian data akan melewati beberapa tahapan yaitu: Text Minning (Tokenzing, Filtering, Stemming, Stopword Removal). Proses berikutnya yaitu pembobotan TF_IDF dan perhitungan Cosine Similarity. Hasil akhir dari proses tersebut adalah tingkat kemiripan antar judul yang di uji. Berdasarkan tahap pengujian yang di lakukan maka dapat disimpulkan bahwa algoritma cosine similarty dapat melakukan perhitungan secara akurat terhadapat kata dengan proses stemming.Hasil pengujian dari empat skema yang di lakukan yaitu, jika membandingkan judul penelitian yang sama dengan judul penelitian yang sama tingkat kemiripanya bobot cosine similarity sebesar 100%. Dalam pengujian kombinasi kata dalam judul maka tingkat nilai cosine similarity yang di hasilkan adalah 100%. Dalam pegujian penghapusan tiga kata di judul yang sama maka tingkat kemiripan cosine similarity yang dihasilkan adalah 85%. Dalam pengujian persamaan kata (sinonim) maka bobot yang di hasilkan adalah 92%.","PeriodicalId":442774,"journal":{"name":"Journal of Engineering, Computer Science and Information Technology (JECSIT)","volume":"4 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-04-10","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":"{\"title\":\"IMPLEMENTASI ALGORITMA COSINE SIMILARITY UNTUK MENDETEKSI KEMIRIPAN TOPIK JUDUL\",\"authors\":\"Heri Sutikno Sutikno\",\"doi\":\"10.33365/jecsit.v1i1.6\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Perkembangan judul penelitian tugas akhir saat ini menyediakan cara yang mudah untuk mencari literatur akademis secara luas. Seseorang dapat mencari di seluruh bidang ilmu dan referensi. Dalam menentukan diterima atau tidaknya sebuah judul skripsi maka yang dilakukan adalah dengan membandingkan judul tersebut judul yang lain secara manual. Tentu saja hal ini akan membutuhkan waktu yang cukup lama. Oleh karena itu, diperlukan suatu sistem yang mampu mendeteksi persentase kemiripan judul secara cepat dan tepat. Tujuan penelitian yaitu membentuk suatu system yang membantu dalam membandingkan beberapa tugas akhir. Dalam sistem ini judul di input kedalam sebuah sistem kemudian data akan melewati beberapa tahapan yaitu: Text Minning (Tokenzing, Filtering, Stemming, Stopword Removal). Proses berikutnya yaitu pembobotan TF_IDF dan perhitungan Cosine Similarity. Hasil akhir dari proses tersebut adalah tingkat kemiripan antar judul yang di uji. Berdasarkan tahap pengujian yang di lakukan maka dapat disimpulkan bahwa algoritma cosine similarty dapat melakukan perhitungan secara akurat terhadapat kata dengan proses stemming.Hasil pengujian dari empat skema yang di lakukan yaitu, jika membandingkan judul penelitian yang sama dengan judul penelitian yang sama tingkat kemiripanya bobot cosine similarity sebesar 100%. Dalam pengujian kombinasi kata dalam judul maka tingkat nilai cosine similarity yang di hasilkan adalah 100%. Dalam pegujian penghapusan tiga kata di judul yang sama maka tingkat kemiripan cosine similarity yang dihasilkan adalah 85%. Dalam pengujian persamaan kata (sinonim) maka bobot yang di hasilkan adalah 92%.\",\"PeriodicalId\":442774,\"journal\":{\"name\":\"Journal of Engineering, Computer Science and Information Technology (JECSIT)\",\"volume\":\"4 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-04-10\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"1\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Journal of Engineering, Computer Science and Information Technology (JECSIT)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.33365/jecsit.v1i1.6\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Engineering, Computer Science and Information Technology (JECSIT)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.33365/jecsit.v1i1.6","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

摘要

目前的期末论文研究标题的发展提供了一种简单的方法来搜索广泛的学术文献。一个人可以搜索所有的科学领域和参考文献。在确定论文是否应该接受或是否应该这样做时,将标题与另一个标题进行比较。当然这需要一段时间。因此,需要一个系统来迅速准确地检测标题相似性。这项研究的目的是建立一个系统,帮助比较一些期末论文。在这个系统中,标题是输入系统,然后数据将跳过几个步骤:文本Minning (tokening, Filtering, stem, Stopword Removal)。下一个过程是TF_IDF渗透和Cosine计算相似。这个过程的最终结果是测试对象之间的相似程度。根据测试的各个阶段,可以得出结论,相似的cosin算法可以通过stemal进程准确地执行计算。测试四种方案的结果是,将相同的研究标题与相同的研究标题比较,相似强度相似,共生体比重为100%。在测试标题中的单词组合时,cosine产生的相似值率是100%。在相同标题中删除三个单词的过程中,cosine相似度的比率是85%。在方程(同义词)中,生成的权重为92%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
IMPLEMENTASI ALGORITMA COSINE SIMILARITY UNTUK MENDETEKSI KEMIRIPAN TOPIK JUDUL
Perkembangan judul penelitian tugas akhir saat ini menyediakan cara yang mudah untuk mencari literatur akademis secara luas. Seseorang dapat mencari di seluruh bidang ilmu dan referensi. Dalam menentukan diterima atau tidaknya sebuah judul skripsi maka yang dilakukan adalah dengan membandingkan judul tersebut judul yang lain secara manual. Tentu saja hal ini akan membutuhkan waktu yang cukup lama. Oleh karena itu, diperlukan suatu sistem yang mampu mendeteksi persentase kemiripan judul secara cepat dan tepat. Tujuan penelitian yaitu membentuk suatu system yang membantu dalam membandingkan beberapa tugas akhir. Dalam sistem ini judul di input kedalam sebuah sistem kemudian data akan melewati beberapa tahapan yaitu: Text Minning (Tokenzing, Filtering, Stemming, Stopword Removal). Proses berikutnya yaitu pembobotan TF_IDF dan perhitungan Cosine Similarity. Hasil akhir dari proses tersebut adalah tingkat kemiripan antar judul yang di uji. Berdasarkan tahap pengujian yang di lakukan maka dapat disimpulkan bahwa algoritma cosine similarty dapat melakukan perhitungan secara akurat terhadapat kata dengan proses stemming.Hasil pengujian dari empat skema yang di lakukan yaitu, jika membandingkan judul penelitian yang sama dengan judul penelitian yang sama tingkat kemiripanya bobot cosine similarity sebesar 100%. Dalam pengujian kombinasi kata dalam judul maka tingkat nilai cosine similarity yang di hasilkan adalah 100%. Dalam pegujian penghapusan tiga kata di judul yang sama maka tingkat kemiripan cosine similarity yang dihasilkan adalah 85%. Dalam pengujian persamaan kata (sinonim) maka bobot yang di hasilkan adalah 92%.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
SISTEM PAKAR DIAGNOSA PENYAKIT KULIT PADA MANUSIA MENGGUNAKAN METODE FORWARD CHAINING DAN CERTAINTY FACTORS IMPLEMENTASI ALGORITMA COSINE SIMILARITY UNTUK MENDETEKSI KEMIRIPAN TOPIK JUDUL SISTEM PAKAR UNTUK MEMPREDIKSI PENYAKIT PADA HEWAN TERNAK SAPI MENGGUNAKAN POHON KEPUTUSAN ID3 DETEKSI OBJEK DENGAN METODE COLOR FILTERING HSV DAN BLOB DETECTION PADA ROBOT VERTICAL TAKE OFF AND LANDING PENGEMBANGAN ARAH HADAP ROBOT DAN LINTASAN PERENCANAAN UNTUK KRAKATAU MSL
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1