土耳其语文本中方面术语抽取的集成方法

Mehmet Umut Salur, I. Aydin, Maen Jamous
{"title":"土耳其语文本中方面术语抽取的集成方法","authors":"Mehmet Umut Salur, I. Aydin, Maen Jamous","doi":"10.5505/pajes.2021.25902","DOIUrl":null,"url":null,"abstract":"Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis","PeriodicalId":44807,"journal":{"name":"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi","volume":"1 1","pages":""},"PeriodicalIF":0.4000,"publicationDate":"2022-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"An ensemble approach for aspect term extraction in Turkish texts\",\"authors\":\"Mehmet Umut Salur, I. Aydin, Maen Jamous\",\"doi\":\"10.5505/pajes.2021.25902\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis\",\"PeriodicalId\":44807,\"journal\":{\"name\":\"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.4000,\"publicationDate\":\"2022-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5505/pajes.2021.25902\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"ENGINEERING, MULTIDISCIPLINARY\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5505/pajes.2021.25902","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 2

摘要

Öz目前,由于标准情感分析的不足,基于方面的情感分析(ABSA)研究引起了极大的兴趣。ABSA揭示了对文本中每个术语/属性的详细情绪和意见。ABSA方法最重要的子阶段是从文本中提取方面术语的过程。这个过程在像土耳其语这样具有黏性语言结构的文本中变得更加困难。在这项研究中,我们提出了一种集成方法,该方法使用统计(TF-IDF)、主题建模(LDA和NMF)和基于规则的方法一起从土耳其用户评论中提取方面术语。该方法将不同方法得到的候选方面项进行策略组合,确定最终的方面项列表。所提出的方法已经在SemEval-2016 ABSA基准数据集上进行了测试,该数据集由土耳其餐馆评论组成。将该方法的实验结果与前人在同一数据集上的研究结果进行了比较。 nn mzde标准duygu analizinin yetersiz kalmasysonucunda, hedef tabanlir duygu analizi (HTDA) çalışmaları b y k ilgi görmüştür。HTDA, bir metindeki her term /nitelik hakkında ayrıntılı duygu ve d ncelerin ortaya çıkarılmasını sağlar。HTDA yönteminin en önemli alt a amasyi, bir metinden hedefterimlerinin çıkarılması i lemidir。 rk gibi sondan eklemeli dil yapılarına ship metinlerde但süreç daha da zorlaşmaktadır。但是çalışmada, t rke kullanıcı yorumlarından hedef terimlerini çıkarmak iin istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural- tabanlylyöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir。Önerilen yöntem, farklyi yöntemlerle elde edilen day hedef terminm kmelerini stratejik olarak birle tiririve nihai hedef terimleri listesini belirler。Önerilen yöntem, t rke restoran yorumlarından olu SemEval-2016 HTDA kıyaslama veri seti zerinde测试edilmi tir。Önerilen yöntemin deneysel sonularyi aynyi veri k mesi zerinde yapılan önceki çalışmalarla karşılaştırılmıştır。Anahtar kelimeler:方面术语提取,基于方面的情感分析,土耳其文本,情感分析
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
An ensemble approach for aspect term extraction in Turkish texts
Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
25.00%
发文量
49
审稿时长
25 weeks
期刊最新文献
Leaky strip aquifer parameter estimation by ratio matching process Particle Swarm Optimization with a new intensification strategy based on K-Means Integration of attention mechanisms into segmentation architectures and their application on breast lymph node images Fractional order PD controller design for third order plants ıncluding time delay An alternative word embedding approach for knowledge representation in online consumers’ reviews
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1