{"title":"Text to Speech untuk Bahasa Arab Menggunakan Perangkaian Diphone","authors":"Achmad Fauzan, S. Hartati","doi":"10.30595/JUITA.V6I1.1787","DOIUrl":null,"url":null,"abstract":"Bahasa Arab merupakan salah satu bahasa yang banyak digunakan di dunia. Di Indonesia yang mayoritas penduduknya beragama Islam, bahasa Arab digunakan sebagai bagian dalam mempelajari Al-Qur’an yang menggunakan tulisan berbahasa Arab. Namun berdasarkan data BPS tahun 2015, sebanyak 54 persen muslim di Indonesia masih buta aksara Al Qur’an/bahasa Arab. Penelitian ini bertujuan merancang dan menyusun sistem text to speech yang dapat membangkitkan suara pengucapan untuk teks masukan berbahasa Arab. Pada proses normalisasi teks masukan, karakter ilegal dihilangkan dan karakter angka diubah ke dalam bentuk penulisan pelafalannya. Ketentuan pengucapan dasar diperoleh menggunakan pendekatan berbasis aturan. Aturan-aturan yang diterapkan adalah hukum bacaan nun sukun dan tanwin, vokal rangkap, bacaan panjang (madd), tanwin, tasydid, ta marbutah, dan sukun. Identifikasi hukum bacaan nun sukun dan tanwin dilakukan dengan menerapkan konsep mesin mealy yang merupakan pengembangan dari finite state automata. Proses pembangkitan suara diawali dengan membuat kode diphone dari rangkaian fonem hasil modul text to phoneme. Kode-kode diphone digunakan untuk memanggil dan merangkai file-file suara diphone yang telah direkam. Keluaran yang dihasilkan berupa sebuah file suara. Pengujian dilakukan dengan melibatkan 13 responden yang memahami ilmu tajwid. Pada pengujian menggunakan teks masukan hukum bacaan idghaam bilaagunnah, idghaam bighunnah, iqlab, ikhfa’ adna, ta marbutah, dan sukun, 100% responden menilai suara yang dihasilkan sudah tepat. Sedangkan dengan teks masukan hukum bacaan idzhaar, responden yang menilai suara dihasilkan sudah tepat mencapai 92%. Persentase lebih rendah terdapat pada hukum bacaan vokal rangkap (diftong), ikhfa’ ausath, tasydid, ikhfa’ aqrab, dan bacaan panjang (madd) yang masing-masing memperoleh 81%, 77%, 73%, 69%, dan 65%. Kata kunci – text to speech, bahasa Arab, perangkaian diphone, finite state automata.","PeriodicalId":151254,"journal":{"name":"JUITA : Jurnal Informatika","volume":"5 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-05-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"3","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"JUITA : Jurnal Informatika","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.30595/JUITA.V6I1.1787","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 3
Abstract
Bahasa Arab merupakan salah satu bahasa yang banyak digunakan di dunia. Di Indonesia yang mayoritas penduduknya beragama Islam, bahasa Arab digunakan sebagai bagian dalam mempelajari Al-Qur’an yang menggunakan tulisan berbahasa Arab. Namun berdasarkan data BPS tahun 2015, sebanyak 54 persen muslim di Indonesia masih buta aksara Al Qur’an/bahasa Arab. Penelitian ini bertujuan merancang dan menyusun sistem text to speech yang dapat membangkitkan suara pengucapan untuk teks masukan berbahasa Arab. Pada proses normalisasi teks masukan, karakter ilegal dihilangkan dan karakter angka diubah ke dalam bentuk penulisan pelafalannya. Ketentuan pengucapan dasar diperoleh menggunakan pendekatan berbasis aturan. Aturan-aturan yang diterapkan adalah hukum bacaan nun sukun dan tanwin, vokal rangkap, bacaan panjang (madd), tanwin, tasydid, ta marbutah, dan sukun. Identifikasi hukum bacaan nun sukun dan tanwin dilakukan dengan menerapkan konsep mesin mealy yang merupakan pengembangan dari finite state automata. Proses pembangkitan suara diawali dengan membuat kode diphone dari rangkaian fonem hasil modul text to phoneme. Kode-kode diphone digunakan untuk memanggil dan merangkai file-file suara diphone yang telah direkam. Keluaran yang dihasilkan berupa sebuah file suara. Pengujian dilakukan dengan melibatkan 13 responden yang memahami ilmu tajwid. Pada pengujian menggunakan teks masukan hukum bacaan idghaam bilaagunnah, idghaam bighunnah, iqlab, ikhfa’ adna, ta marbutah, dan sukun, 100% responden menilai suara yang dihasilkan sudah tepat. Sedangkan dengan teks masukan hukum bacaan idzhaar, responden yang menilai suara dihasilkan sudah tepat mencapai 92%. Persentase lebih rendah terdapat pada hukum bacaan vokal rangkap (diftong), ikhfa’ ausath, tasydid, ikhfa’ aqrab, dan bacaan panjang (madd) yang masing-masing memperoleh 81%, 77%, 73%, 69%, dan 65%. Kata kunci – text to speech, bahasa Arab, perangkaian diphone, finite state automata.
阿拉伯语是世界上最广泛使用的语言之一。在大多数穆斯林居住的印度尼西亚,阿拉伯语被用作学习用阿拉伯语书写的古兰经的一部分。但是根据2015年BPS的数据,54%的印尼穆斯林仍然不懂古兰经。它的目的是设计和建立一种能唤起阿拉伯语输入文本发音的文本系统。在输入文本正常化过程中,非法字符被删除,数字字符被修改成拼写的形式。基本的发音规则是通过基于规则的方法获得的。这些规定包括萨奴·面包昆和坦温的文学律法,双重元音,长语录,tanwin, tasydid, ta marbutah和sukun。嫩·sukun和tanwin的阅读律法是通过应用mealy引擎的概念来确定的,这是finite state automata的发展。声音的生成过程从文本模块的音素序列中创建一个diphone代码。diphone代码被用来调用和整理被录音的diphone语音文件。输出是一个音频文件。这项测试包括13名精通tajwid的受访者。在测试中,100%的受访者认为声音是正确的。至于以idzhaar阅读法文输入文本,评定声音的受访者目前已达到92%。较低的百分比可以在双元音阅读法(diftong)、“ausath”、tasydid、aqrab”和“madd”等长语法中找到,这些语速分别为81%、77%、73%、69%和65%。关键词——阿拉伯语、可辨识性、电话订阅、finite state automata。