Analiza sentimenta komentarjev hotelov z uporabo slovarjev in metode Naivni Bayes

Nina Murks, Anže Omerzu, Borko Bošković
{"title":"Analiza sentimenta komentarjev hotelov z uporabo slovarjev in metode Naivni Bayes","authors":"Nina Murks, Anže Omerzu, Borko Bošković","doi":"10.18690/978-961-286-516-0.15","DOIUrl":null,"url":null,"abstract":"V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.","PeriodicalId":282591,"journal":{"name":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","volume":"10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18690/978-961-286-516-0.15","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
在本文中,我们介绍了一种使用词典和 Naive Bayes 方法分析酒店客人评论情感的方法。首先,我们构建了情感词典,其中包含 n 个语法及其属于正面或负面类别的概率。然后,利用建立的词典,我们采用 Naive Bayes 方法对酒店评论进行分类。在对评论进行分类时,我们可以使用分类值来找出每条评论属于正面或负面的概率。我们使用单字符和双字符对评论进行了分类,并将结果与文献中的结果进行了比较。单字词分类的准确率为 0.92,双字词分类的准确率为 0.80。我们存储了单条评论的分类规律,并在分类为负面的评论上添加了负号。然后,我们将每家酒店的分类值相加,计算出分配给酒店的分数。在我们的案例中,酒店分数是酒店客人整体满意度的一个指标,可以在评论中找到。根据得分,我们对酒店进行了排序,得出了正面评论最多的酒店排名。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
Leaf Segmentation of Rosette Plants using Rough K-Means in CIELab Color Space System for Remote Collaborative Embedded Development Adversarial Image Perturbation with a Genetic Algorithm Interactive Evolutionary Computation Approach to Permutation Flow Shop Scheduling Problem Methodology for the Assessment of the Text Similarity of Documents in the CORE Open Access Data Set of Scholarly Documents
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1