Pengukuran Kemiripan Makna Kalimat dalam Bahasa Indonesia Menggunakan Metode Path

Yessy Caterina, M. A. Yaqin, Syahiduz Zaman
{"title":"Pengukuran Kemiripan Makna Kalimat dalam Bahasa Indonesia Menggunakan Metode Path","authors":"Yessy Caterina, M. A. Yaqin, Syahiduz Zaman","doi":"10.21111/FIJ.V6I2.4844","DOIUrl":null,"url":null,"abstract":"Abstrak Pengukuran kemiripan makna kalimat bertujuan untuk didapatkan nilai kemiripan antar satu kalimat dengan kalimat yang lain. Nilai kemiripan yang didapatkan tersebut kemudian dapat diimplementasikan untuk pengembangan sistem yang berbasis matching sentence, misalnya search engine. Pada beberapa penelitian yang dilakukan sebelumnya, membahas mengenai efektivitas algoritma semantik dalam mengukur kemiripan makna kalimat dalam bahasa Inggris. Sedangkan, penelitian ini mencari kemiripan makna antar kalimat dalam bahasa Indonesia. Dataset  dalam pencarian dan pengukuran makna kalimat pada penelitian ini menggunakan sinonimkata.com yang berupa node atau percabangan. Pada perhitungan kemiripan makna kalimat menggunakan WordNet, pendekatan  yang digunakan ialah Wu Palmer, Lin, Path, Resnik, dan Hirst-St (HSO). Pada penelitian ini menggunakan pendekatan path karena paling sesuai untuk menghitung jumlah node atau relasi yang terhubung antar node lain dalam sinonimkata.com. Pengukuran ini dilakukan dengan 5 eksperimen yakni, berdasarkan susunan kalimat kata kerja – kata benda,  kalimat aktif – kalimat pasif (makna sama), 2 kalimat aktif, 2 kalimat pasif, dan kalimat aktif – kalimat pasif (makna berbeda). Menghitung nilai kemiripan kata diurai dengan kriteria kelas kata kerja, dan kata benda kemudian dihitung berdasarkan contextual menggunakan pendekatan path yang kemiripan katanya dicari menggunakan sinonimkata.com. Dari proses perhitungan kelima eksperimen tersebut, dapat dihasilkan kemiripan kalimat dalam bahasa Indonesia yang memiliki tingkat kemiripan yang tinggi bernilai 0,875 pada eksperimen kriteria kalimat dengan susunan kata kerja – kata benda. Kata kunci : kemiripan makna kalimat, sinonimkata.com, path Abstract [Measurement of the sentence similarity in Indonesian using the path method ] Measurement of the sentence similarity aims to obtain the value of similarity between one sentence and another sentence. The similarity value obtained can be implemented for the development of a based system on matching sentences, for example, search engines. In s everal previous studies, discuss ed the effectiveness of semantic algorithms in measuring the sentence similarity meanings in English . Meanw hile , this research looks for similarities of the meaning of one sentence to another in Indonesian. The dataset in the search and measurement of the sentence similarity in this study using sinonimkata.com in the form of nodes or branches. In the calculation of the sentence similarity meanings using WordNet, the approach used is Wu Palmer, Lin, Path, Resnik, and Hirst-St (HSO). This study uses a path approach because it is best suited to calculate the number of nodes or relationships connected between other nodes in sinonimkata.com. This measurement was done with 5 experiment s, based on the composition of verb sentences – nouns, active sentences – passive sentences (same meaning), 2 active sentences, 2 passive sentences, and active sentences – passive sentences (different meanings). Calculating the likeness value of a word is parsed with the criteria of a verb class, and the noun is then calculated based on contextual using a path approach whose similarity is searched using sinonimkata.com. From the calculation process of the five experiments, it can be produced a sentences similarity in Indonesian that has a high level of similarity worth 0.875 in the experiment of sentence criteria with the arrangement of verbs – nouns. Keywords : sentence similarity, sinonimkata.com, path","PeriodicalId":33722,"journal":{"name":"Fountain of Informatics Journal","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2021-03-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Fountain of Informatics Journal","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.21111/FIJ.V6I2.4844","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 2

Abstract

Abstrak Pengukuran kemiripan makna kalimat bertujuan untuk didapatkan nilai kemiripan antar satu kalimat dengan kalimat yang lain. Nilai kemiripan yang didapatkan tersebut kemudian dapat diimplementasikan untuk pengembangan sistem yang berbasis matching sentence, misalnya search engine. Pada beberapa penelitian yang dilakukan sebelumnya, membahas mengenai efektivitas algoritma semantik dalam mengukur kemiripan makna kalimat dalam bahasa Inggris. Sedangkan, penelitian ini mencari kemiripan makna antar kalimat dalam bahasa Indonesia. Dataset  dalam pencarian dan pengukuran makna kalimat pada penelitian ini menggunakan sinonimkata.com yang berupa node atau percabangan. Pada perhitungan kemiripan makna kalimat menggunakan WordNet, pendekatan  yang digunakan ialah Wu Palmer, Lin, Path, Resnik, dan Hirst-St (HSO). Pada penelitian ini menggunakan pendekatan path karena paling sesuai untuk menghitung jumlah node atau relasi yang terhubung antar node lain dalam sinonimkata.com. Pengukuran ini dilakukan dengan 5 eksperimen yakni, berdasarkan susunan kalimat kata kerja – kata benda,  kalimat aktif – kalimat pasif (makna sama), 2 kalimat aktif, 2 kalimat pasif, dan kalimat aktif – kalimat pasif (makna berbeda). Menghitung nilai kemiripan kata diurai dengan kriteria kelas kata kerja, dan kata benda kemudian dihitung berdasarkan contextual menggunakan pendekatan path yang kemiripan katanya dicari menggunakan sinonimkata.com. Dari proses perhitungan kelima eksperimen tersebut, dapat dihasilkan kemiripan kalimat dalam bahasa Indonesia yang memiliki tingkat kemiripan yang tinggi bernilai 0,875 pada eksperimen kriteria kalimat dengan susunan kata kerja – kata benda. Kata kunci : kemiripan makna kalimat, sinonimkata.com, path Abstract [Measurement of the sentence similarity in Indonesian using the path method ] Measurement of the sentence similarity aims to obtain the value of similarity between one sentence and another sentence. The similarity value obtained can be implemented for the development of a based system on matching sentences, for example, search engines. In s everal previous studies, discuss ed the effectiveness of semantic algorithms in measuring the sentence similarity meanings in English . Meanw hile , this research looks for similarities of the meaning of one sentence to another in Indonesian. The dataset in the search and measurement of the sentence similarity in this study using sinonimkata.com in the form of nodes or branches. In the calculation of the sentence similarity meanings using WordNet, the approach used is Wu Palmer, Lin, Path, Resnik, and Hirst-St (HSO). This study uses a path approach because it is best suited to calculate the number of nodes or relationships connected between other nodes in sinonimkata.com. This measurement was done with 5 experiment s, based on the composition of verb sentences – nouns, active sentences – passive sentences (same meaning), 2 active sentences, 2 passive sentences, and active sentences – passive sentences (different meanings). Calculating the likeness value of a word is parsed with the criteria of a verb class, and the noun is then calculated based on contextual using a path approach whose similarity is searched using sinonimkata.com. From the calculation process of the five experiments, it can be produced a sentences similarity in Indonesian that has a high level of similarity worth 0.875 in the experiment of sentence criteria with the arrangement of verbs – nouns. Keywords : sentence similarity, sinonimkata.com, path
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
印尼语中使用方法路径的句子匹配
摘要相似性度量是指一个句子,旨在获得与另一个句子之间的相似性值。然后获得的相似性的值可以用于基于匹配语句的系统开发,例如搜索引擎。在之前的一些研究中,我们讨论了语义算法在测量英语单词相似性方面的有效性。然而,这项研究寻求印尼语句子之间的相似性。在本研究中,使用同义词网站作为节点或扩展来搜索和测量句子含义的数据集。在使用WordNet计算单词相似度时,使用的方法有Wu-Palmer、Lin、Path、Resnik和Hirst-St(HSO)。在这项研究中,它使用了路径方法,因为最好计算同义词kata.com中其他节点之间连接的节点或关系的数量。这项测量通过5个实验完成,即基于单词work–word、主动词–passive(相同含义)、2个主动词、2个被动词的顺序,主动词-被动词。计算一个单词相似性的值是通过工作单词类别标准来衡量的,然后使用路径法通过上下文来计算这个单词,他说相似性是在sinonimkata.com上寻找的。从计算五个实验的过程来看,-可以在印尼语中产生一个短语相似性,在单词-事物的顺序的实验短语标准上具有0.875的高度相似性。关键词:相似性含义kalimat,sinonimkata.com,路径摘要【使用路径法测量印尼语句子的相似性】句子相似性的测量旨在获得一个句子与另一个句子之间的相似性值。所获得的相似性值可以用于开发基于匹配语句的系统,例如搜索引擎。在以往的一些研究中,讨论了语义算法在测量英语句子相似意义方面的有效性。同时,这项研究寻找印尼语中一个句子和另一个句子含义的相似性。数据集在搜索和测量本研究中使用sinonimkata.com以节点或分支的形式进行句子相似性。在使用WordNet计算句子相似意义时,使用的方法是Wu-Palmer、Lin、Path、Resnik和Hirst-St(HSO)。这项研究使用路径法,因为它最适合计算sinonimkata.com中其他节点之间连接的节点或关系的数量。这项测量是用5个实验完成的,基于动词句-名词、主动句-被动句(相同含义)、2个主动句、2个被动句的组成,-主动句-被动句(含义不同)。计算一个单词的相似度值是根据动词类的标准来解析的,然后使用路径方法基于上下文来计算名词,该方法的相似度是通过sinonimkata.com来搜索的,在动词-名词排列的句子标准实验中,印尼语的句子相似性可以产生0.875的高水平相似性。关键词:句子相似性,sinonimkata.com,路径
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
24 weeks
期刊最新文献
Analisis Pengaruh Diameter Kawat terhadap Distribusi Kapasitansi dari Wire Mesh Sensor Tomography menggunakan Convolutional Neural Network Desain Level Berbasis Storyboard Pada Perancangan Game Edukasi Augmented Reality Tap The Trash Penerapan Dialog System Pada Game Doa Harian Menggunakan Metode Mechanics Dynamics Aesthetics Framework Sistem Informasi Produksi Tanaman Karet (Hevea Brasiliensis) Di Kecamatan Koto VII, Kabupaten Sijunjung Integrated Stock Information System on Smartphone Stores
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1