{"title":"Analiza sentimenta komentarjev hotelov z uporabo slovarjev in metode Naivni Bayes","authors":"Nina Murks, Anže Omerzu, Borko Bošković","doi":"10.18690/978-961-286-516-0.15","DOIUrl":null,"url":null,"abstract":"V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.","PeriodicalId":282591,"journal":{"name":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","volume":"10 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Proceedings of the 2021 7th Student Computer Science Research Conference (StuCoSReC)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18690/978-961-286-516-0.15","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
V £lanku smo predstavili pristop k analizi sen-timenta komentarjev hotelskih gostov s pomo£jo slovarjev in metode Naivni Bayes. Najprej smo zgradili slovarja sentimenta, ki sta vsebovala n-grame, ter njihove verjetnosti, da pripadajo pozi-tivnemu ali negativnemu razredu. Nato smo s po-mo£jo zgrajenih slovarjev klasificirali komentarje hotelov, pri £emer smo uporabili metodo Naivni Bayes. Pri klasifikaciji komentarjev s mo ra£u-nali klasifikacijske vrednosti o z. verjetnosti, da so posamezni komentarji pozitivni ali negativni. Komentarje smo klasificirali s p omo£jo unigra-mov in bigramov, ter rezultate primerjali z re-zultati iz literature. Pri unigramih smo dosegli natan£nost 0,92, pri bigramih je natan£nost zna-šala 0,80. Klasifikacijske v rednosti posameznih komentarjev smo si shranili, pri £emer smo pri komentarjih, ki smo jih klacificirali kot negativne, dodali negativen predznak. Predzna£ene klasifi-kacijske vrednosti smo nato sešteli, za vsak hotel ter na tak na£in izra£unali hotelom pripadajo£e to£ke. To£ke hotelov so v našem primeru poka-zatelj splošnega zadovoljstva hotelskih gostov, ki ga najdemo v komentarjih. Glede na to£ke smo hotele uredili po vrsti in prišli do lestvice hote-lov, pri katerih najdemo najbolj pozitivne komen-tarje.