{"title":"土耳其语文本中方面术语抽取的集成方法","authors":"Mehmet Umut Salur, I. Aydin, Maen Jamous","doi":"10.5505/pajes.2021.25902","DOIUrl":null,"url":null,"abstract":"Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis","PeriodicalId":44807,"journal":{"name":"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi","volume":"1 1","pages":""},"PeriodicalIF":0.4000,"publicationDate":"2022-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"2","resultStr":"{\"title\":\"An ensemble approach for aspect term extraction in Turkish texts\",\"authors\":\"Mehmet Umut Salur, I. Aydin, Maen Jamous\",\"doi\":\"10.5505/pajes.2021.25902\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis\",\"PeriodicalId\":44807,\"journal\":{\"name\":\"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi\",\"volume\":\"1 1\",\"pages\":\"\"},\"PeriodicalIF\":0.4000,\"publicationDate\":\"2022-01-01\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"2\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5505/pajes.2021.25902\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"Q4\",\"JCRName\":\"ENGINEERING, MULTIDISCIPLINARY\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Pamukkale University Journal of Engineering Sciences-Pamukkale Universitesi Muhendislik Bilimleri Dergisi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5505/pajes.2021.25902","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q4","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 2
摘要
Öz目前,由于标准情感分析的不足,基于方面的情感分析(ABSA)研究引起了极大的兴趣。ABSA揭示了对文本中每个术语/属性的详细情绪和意见。ABSA方法最重要的子阶段是从文本中提取方面术语的过程。这个过程在像土耳其语这样具有黏性语言结构的文本中变得更加困难。在这项研究中,我们提出了一种集成方法,该方法使用统计(TF-IDF)、主题建模(LDA和NMF)和基于规则的方法一起从土耳其用户评论中提取方面术语。该方法将不同方法得到的候选方面项进行策略组合,确定最终的方面项列表。所提出的方法已经在SemEval-2016 ABSA基准数据集上进行了测试,该数据集由土耳其餐馆评论组成。将该方法的实验结果与前人在同一数据集上的研究结果进行了比较。 nn mzde标准duygu analizinin yetersiz kalmasysonucunda, hedef tabanlir duygu analizi (HTDA) çalışmaları b y k ilgi görmüştür。HTDA, bir metindeki her term /nitelik hakkında ayrıntılı duygu ve d ncelerin ortaya çıkarılmasını sağlar。HTDA yönteminin en önemli alt a amasyi, bir metinden hedefterimlerinin çıkarılması i lemidir。 rk gibi sondan eklemeli dil yapılarına ship metinlerde但süreç daha da zorlaşmaktadır。但是çalışmada, t rke kullanıcı yorumlarından hedef terimlerini çıkarmak iin istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural- tabanlylyöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir。Önerilen yöntem, farklyi yöntemlerle elde edilen day hedef terminm kmelerini stratejik olarak birle tiririve nihai hedef terimleri listesini belirler。Önerilen yöntem, t rke restoran yorumlarından olu SemEval-2016 HTDA kıyaslama veri seti zerinde测试edilmi tir。Önerilen yöntemin deneysel sonularyi aynyi veri k mesi zerinde yapılan önceki çalışmalarla karşılaştırılmıştır。Anahtar kelimeler:方面术语提取,基于方面的情感分析,土耳其文本,情感分析
An ensemble approach for aspect term extraction in Turkish texts
Öz Today, as a result of the inadequacies of the standard sentiment analysis, aspect-based sentiment analysis (ABSA) studies have great attracting interest. ABSA reveals detailed sentiment and opinion about every term/attribute in a text. The most important sub-stage of the ABSA method is the process of extracting the aspect terms from a text. This process becomes more difficult in texts with agglutinative language structures such as Turkish. In this study, we proposed an ensemble approach that uses statistical (TF-IDF), topic modeling (LDA and NMF), and rule-based methods together to extract aspect terms from Turkish user comments. The proposed method strategically combines the candidate aspect term obtained by different methods and determines the final aspect term lists. The proposed method has been tested on the SemEval-2016 ABSA benchmarking dataset, which consists of Turkish restaurant reviews. The experimental results of the proposed method were compared with previous studies on the same dataset. Günümüzde standart duygu analizinin yetersiz kalması sonucunda, hedef tabanlı duygu analizi (HTDA) çalışmaları büyük ilgi görmüştür. HTDA, bir metindeki her terim/nitelik hakkında ayrıntılı duygu ve düşüncelerin ortaya çıkarılmasını sağlar. HTDA yönteminin en önemli alt aşaması, bir metinden hedef terimlerinin çıkarılması işlemidir. Türkçe gibi sondan eklemeli dil yapılarına sahip metinlerde bu süreç daha da zorlaşmaktadır. Bu çalışmada, Türkçe kullanıcı yorumlarından hedef terimlerini çıkarmak için istatistiksel (TF-IDF), konu modelleme (LDA ve NMF) ve kural-tabanlı yöntemleri bir arada kullanan bir topluluk yaklaşımı önerilmiştir. Önerilen yöntem, farklı yöntemlerle elde edilen aday hedef terim kümelerini stratejik olarak birleştirir ve nihai hedef terimleri listesini belirler. Önerilen yöntem, Türkçe restoran yorumlarından oluşan SemEval-2016 HTDA kıyaslama veri seti üzerinde test edilmiştir. Önerilen yöntemin deneysel sonuçları aynı veri kümesi üzerinde yapılan önceki çalışmalarla karşılaştırılmıştır. Anahtar kelimeler: Aspect term extraction, Aspect based sentiment analysis, Turkish texts, Sentiment analysis