Fatan Kasyidi, Ridwan Ilyas, N. Annisa
{"title":"Peningkatan Kemampuan Pengenalan Emosi Melalui Suara dalam Bahasa Indonesia","authors":"Fatan Kasyidi, Ridwan Ilyas, N. Annisa","doi":"10.26760/mindjournal.v6i2.194-204","DOIUrl":null,"url":null,"abstract":"AbstrakInteraksi manusia dengan komputer merupakan fenomena yang terus berkembang diikuti oleh meningkatnya penggunaan komputer yang sering digunakan dalam ranah sosial manusia. Manusia saling berinteraksi dengan melibatkan emosi untuk memahami seseorang. Emosi manusia seringkali terwakili melalui cara berbicara. Penelitian tentang pengenalan emosi melalui suara telah banyak dilakukan, namun terdapat upaya peningkatan pengenalan emosi melalui suara, terutama masalah korpus yang menjadi salah satu faktor yang menjadikan pengenalan emosi ini belum menghasilkan akurasi pengenalan yang optimal, khususnya berkaitan dengan imbalance data. Penelitian ini dilakukan untuk meningkatkan performa pengenalan emosi untuk mengenali lima kelas emosi yaitu senang, marah, sedih dan kepuasan serta netral menggunakan algoritma boosting. Selain itu, digunakan pula metode seperti CNN dan RNN untuk dapat dilakukan perbandingan serta penerapan SMOTE untuk korpusnya. Setelah eksperimen, dapat dihasilkan akurasi pengenalan mencapai 65% untuk akurasi untuk data tes berdasarkan konfigurasi 22050 Hz sebagai sampling rate, MFCCs dan oversampling SMOTE.Kata kunci: Imbalance data, Algoritma Boosting, CNN, RNN, SMOTEAbstractHuman interaction with computers are a growing phenomenon followed by the increasing use of computers which are often utilized in human social activities. Humans interact with one another by involving emotions. Plenty of research on speech emotion recognition has been established. Nevertheless, there are still efforts to enhance speech emotion recognition, especially the corpus problem which is one of the factors that the model does not in an optimal performance, especially about imbalance data. This study was conducted to enhance the performance of emotion recognition to recognize five class emotions: happiness, angry, sadness, contentment, and neutral. Furthermore, we employed CNN, RNN, and Boosting Algorithms. Lastly, we applied SMOTE to the corpus. After the experiment, the accuracy reached 65% with 22050 Hz configuration as rate, MFCCs, and SMOTE oversampling.Keywords: Data Imbalance, Boosting Algorithms, CNN, RNN, SMOTE","PeriodicalId":43900,"journal":{"name":"Time & Mind-The Journal of Archaeology Consciousness and Culture","volume":"3 1","pages":""},"PeriodicalIF":0.7000,"publicationDate":"2021-12-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Time & Mind-The Journal of Archaeology Consciousness and Culture","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.26760/mindjournal.v6i2.194-204","RegionNum":4,"RegionCategory":"历史学","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"0","JCRName":"ARCHAEOLOGY","Score":null,"Total":0}
引用次数: 0

摘要

人类与计算机的非交互现象是一种持续发展的现象,其次是在人类社会领域中频繁使用计算机的现象。人类通过情感相互作用来理解一个人。人类的情感常常通过说话来表现。关于声音情感识别的研究有很多,但是声音情感识别的尝试有所增加,尤其是角膜问题,这是导致这种情感识别还没有最优认率的因素之一,尤其是在数据扫描方面。本研究旨在提高情绪识别性能,使用booting算法识别五门情绪课,分别是快乐、愤怒、悲伤和满足和中立。此外,CNN (CNN)和RNN (RNN)等方法也被用来比较和对其皮质的使用。实验完成后,我们可以根据22050 Hz的抽样率、MFCCs和烟体叠加配置来确定识别准确率达到65%。关键词:数据扫描,增强算法,CNN, RNN, smotestracthuman interaction与计算机的关系是由人类社会活动中十项功利的计算机的增量所固有的现象。人类与另一个相互作用的情感相结合。关于演讲情感问答的大量研究已经建立。然而,仍有努力适应演讲情感识别,特别是人身保护令,这是模型缺乏最佳表现的因素之一,特别是数据扫描方面。这项研究是为了适应五年级情感表现的习得:幸福、愤怒、悲伤、包容和中立。进一步,我们开发了CNN、RNN和booms算法。最近,我们申请了遗体。经过实验,聚合率、MFCCs和抽样计算达到了65%。扫描数据,输入算法,CNN, RNN, SMOTE
本文章由计算机程序翻译,如有差异,请以英文原文为准。
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
Peningkatan Kemampuan Pengenalan Emosi Melalui Suara dalam Bahasa Indonesia
AbstrakInteraksi manusia dengan komputer merupakan fenomena yang terus berkembang diikuti oleh meningkatnya penggunaan komputer yang sering digunakan dalam ranah sosial manusia. Manusia saling berinteraksi dengan melibatkan emosi untuk memahami seseorang. Emosi manusia seringkali terwakili melalui cara berbicara. Penelitian tentang pengenalan emosi melalui suara telah banyak dilakukan, namun terdapat upaya peningkatan pengenalan emosi melalui suara, terutama masalah korpus yang menjadi salah satu faktor yang menjadikan pengenalan emosi ini belum menghasilkan akurasi pengenalan yang optimal, khususnya berkaitan dengan imbalance data. Penelitian ini dilakukan untuk meningkatkan performa pengenalan emosi untuk mengenali lima kelas emosi yaitu senang, marah, sedih dan kepuasan serta netral menggunakan algoritma boosting. Selain itu, digunakan pula metode seperti CNN dan RNN untuk dapat dilakukan perbandingan serta penerapan SMOTE untuk korpusnya. Setelah eksperimen, dapat dihasilkan akurasi pengenalan mencapai 65% untuk akurasi untuk data tes berdasarkan konfigurasi 22050 Hz sebagai sampling rate, MFCCs dan oversampling SMOTE.Kata kunci: Imbalance data, Algoritma Boosting, CNN, RNN, SMOTEAbstractHuman interaction with computers are a growing phenomenon followed by the increasing use of computers which are often utilized in human social activities. Humans interact with one another by involving emotions. Plenty of research on speech emotion recognition has been established. Nevertheless, there are still efforts to enhance speech emotion recognition, especially the corpus problem which is one of the factors that the model does not in an optimal performance, especially about imbalance data. This study was conducted to enhance the performance of emotion recognition to recognize five class emotions: happiness, angry, sadness, contentment, and neutral. Furthermore, we employed CNN, RNN, and Boosting Algorithms. Lastly, we applied SMOTE to the corpus. After the experiment, the accuracy reached 65% with 22050 Hz configuration as rate, MFCCs, and SMOTE oversampling.Keywords: Data Imbalance, Boosting Algorithms, CNN, RNN, SMOTE
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
CiteScore
1.60
自引率
0.00%
发文量
23
期刊最新文献
The Rough Tor Effect: early prehistoric monuments focusing on significant tors in Cornwall Apolline divination: hallucinogenic substances or cognitive inputs? The case of the laurel Performance theory: a growing interest in rock art research Archaeology at the intersection between cognitive neuroscience, performance theory, and architecture: from psychoactive substances to rock art and bone shelters Living inside a mammoth
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1