Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme

IF 1 4区 工程技术 Q3 ENGINEERING, MULTIDISCIPLINARY Journal of the Faculty of Engineering and Architecture of Gazi University Pub Date : 2023-03-16 DOI:10.17341/gazimmfd.963240
Abdulkadir Karaca, Özlem Aydin
{"title":"Transformatör mimarisi tabanlı derin öğrenme yöntemi ile Türkçe haber metinlerine başlık üretme","authors":"Abdulkadir Karaca, Özlem Aydin","doi":"10.17341/gazimmfd.963240","DOIUrl":null,"url":null,"abstract":"Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır. \n \nÇalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır. \n \nEğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür. \n \nTransformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.","PeriodicalId":51103,"journal":{"name":"Journal of the Faculty of Engineering and Architecture of Gazi University","volume":"1 1","pages":""},"PeriodicalIF":1.0000,"publicationDate":"2023-03-16","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of the Faculty of Engineering and Architecture of Gazi University","FirstCategoryId":"5","ListUrlMain":"https://doi.org/10.17341/gazimmfd.963240","RegionNum":4,"RegionCategory":"工程技术","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"ENGINEERING, MULTIDISCIPLINARY","Score":null,"Total":0}
引用次数: 0

Abstract

Günümüzde, büyük veri içinden istenilen bilgiyi kapsayan doğru içeriklere kısa sürede ulaşabilmek önemli bir ihtiyaçtır. İçeriklere ait başlıkların bu ihtiyacı karşılamada olumlu bir etkisi bulunmaktadır. Ancak yanıltıcı başlıklar olması durumunda bu bir dezavantaja dönüşebilmektedir. Bu çalışmada, güncel doğal dil işleme ve derin öğrenme teknolojilerini kullanarak Türkçe metinleri en iyi özetler biçimde ve daha yönlendirici Türkçe başlıkların üretilmesi amaçlanmaktadır. Çalışmada yaklaşık 52.000 Türkçe haber metni ve başlığını içeren bir derlem kullanılmıştır. Derlemdeki haber metinleri ve başlıkları modelin doğru eğitilebilmesi için bazı ön işlemlerden geçirilmiştir. Daha insansı ve özgün sonuçlar elde etmek amacıyla genel ve soyut özetleme teknikleri çözüm yöntemleri olarak tercih edilmiştir. Eğitim modeli olarak, 2017 yılında yayınlanan ve doğal dil işleme alanında en son teknoloji olarak kabul edilen transformatör mimarisi tabanlı kodlayıcı-kod çözücü derin öğrenme mimarisi kullanılmıştır. Bu model, derin öğrenme kütüphanelerinden TensorFlow ve Keras kullanılarak geliştirilmiştir. Derin öğrenme çalışmalarında yüksek sistem gereksinimlerini karşılayan Google Colab aracılığı ile 20 ve 25 dönem eğitilerek sonuç üretilmiştir. Eğitim süresi toplam 3.5 saat gibi kısa bir sürede tamamlanmıştır. Eğitilen model, 20 ve 25 eğitim dönemi sonunda sırayla 75% ve 85% oranında eğitim başarımı elde etmiştir. Eğitimde kullanılan veri kümesinin tamamı, eğitilen model ile tekrar üretilmiştir. Bu deneyde başarı ölçütleri olarak, genellikle özetleme görevlerinde tercih edilen ROUGE-1 metriği, BLEU ve ikisinin harmonik ortalaması olan F1 skoru tercih edilmiştir. ROUGE-1, BLEU ve F1 skoru, 20 eğitim dönemi sonunda sırayla %59, %54 ve %55 iken, 25 eğitim dönemi sonunda sırayla %77, %70 ve %73 olarak ölçülmüştür. Transformatör mimarisinin başlık üretme probleminde kullanımının, bu alandaki mevcut çalışmalarda kullanılan derlemlere kıyasla daha az eğitim içeriğiyle çözüm üretebildiği ve diğer derin öğrenme mimarileri ile yapılan çalışmalara göre dilbilgisel ve anlamsal olarak daha başarılı sonuçlar elde edildiği gözlemlenmiştir.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
基于变压器架构深度学习方法的土耳其新闻文本覆盖
今天,重要的是,如果您从大数据中获得所需的信息,您就可以快速访问正确的内容。内部领导人对这一需求产生了积极影响。但如果出现虚假的头条新闻,它可能会演变成一场灾难。在这项工作中,土耳其语文本旨在利用当前的自然语言处理和深度学习技术产生最佳功能和指导土耳其文能力。在工作中,使用了大约52000条土耳其新闻文本和标题。为了在模型中正确地训练新闻文本和标题,已经实现了一些初步过程。人们选择了更多的人类和私人后果作为通用和机器人自我控制技术的解决方案。作为一种教育模式,2017年自然语言处理领域接受的最后一项技术已经被一位基于transformer架构的高度编码的代码解决架构师使用。该模型是从使用TensorFlow和Keras的深度学习库中开发的。Derinöğrenmeçalışmalarında yüksek系统gereksimlerini karşılayan Google Colab aracılığıile 20 ve 25 dönem eğitilerek sonuçüretilmiştir。教育的总时长很快就完成了3.5个小时。在培训期结束时,教育模式分别达到75%和85%。教育中使用的整个数据库都是由经过训练的模型重建的。在这个实验中,成功测量通常倾向于ROUGE-1米、BLEU和F1分数,两者的平均值一致。在20个训练期结束时测量ROUGE-1、BLEU和F1得分,分别为59%、54%、55%,在25个训练期终止时分别为77%、70%和73%。与该领域现有研究中使用的经验教训以及与其他深度学习架构师进行的研究相比,变压器架构师的主要生产问题的使用在语言方面得到了观察,并取得了显著更成功的结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
CiteScore
1.90
自引率
45.50%
发文量
51
审稿时长
6-12 weeks
期刊介绍: Gazi University Journal of the Faculty of Engineering and Architecture; Engineering qualifications described below and in the field of architecture research papers and invited articles by scanning is considered to be Turkish.
期刊最新文献
Makine Öğrenmesi Yöntemleri İle Eğitim Başarısının Tahmini Modeli Dynamic analysis of historıcal masonry arch bridges Zemin güçlendirmede maksimum dayanım için optimum bazalt fiber oranının belirlenmesi Merkez alıcılı güneş kulesi-buhar güç tümleşik sisteminin performans parametrelerinin incelenmesi Sismik dirençlilik ve spektral parametrelerin etkisi
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1