评估深度学习模型在自动手语翻译中的应用

Revista Principia - Divulgação Científica e Tecnológica do IFPB Pub Date : 2024-01-12 DOI:10.18265/2447-9187a2022id8053

Renan Paiva Oliveira Costa, Diego Damasceno Bispo da Silva, Samuel De Moura Moreira, Daniel Faustino Lacerda de Souza, R. Costa, Tiago Maritan Ugulino de Araújo

{"title":"评估深度学习模型在自动手语翻译中的应用","authors":"Renan Paiva Oliveira Costa, Diego Damasceno Bispo da Silva, Samuel De Moura Moreira, Daniel Faustino Lacerda de Souza, R. Costa, Tiago Maritan Ugulino de Araújo","doi":"10.18265/2447-9187a2022id8053","DOIUrl":null,"url":null,"abstract":"Os modelos recentes de Neural Machine Translation (NMT) podem ser aplicados a idiomas e domínios de poucos recursos sem limitações. Alguns trabalhos investigam se novas técnicas de NMT também podem ser generalizadas para diferentes recursos no que diz respeito à disponibilidade de dados e recursos computacionais. Nesse contexto, o objetivo geral deste estudo foi explorar métodos modernos de NMT e analisar a sua potencial aplicabilidade em contextos de poucos recursos, como é o caso das línguas de sinais. Para uma melhor avaliação, foram adaptados e utilizados alguns modelos promissores identificados no componente de tradução automática da Suíte VLibras e os resultados obtidos foram comparados com aqueles atualmente fornecidos pela atual arquitetura LightConv, sendo utilizado o mesmo corpus bilíngue Português-LIBRAS de treinamento e validação com mais de 70.000 sentenças geradas por linguístas, um dos maiores desse tipo disponíveis no mundo. Os resultados indicam que a adoção de uma das duas arquiteturas de melhor desempenho (Basic Transformer ou ByT5) ajudaria a melhorar a precisão e a qualidade da tradução da Suite VLibras, com um aumento percentual de até 12,73% considerando a métrica BLEU.","PeriodicalId":21386,"journal":{"name":"Revista Principia - Divulgação Científica e Tecnológica do IFPB","volume":" 10","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-01-12","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Avaliação do uso de modelos de aprendizagem profunda na tradução automática de línguas de sinais\",\"authors\":\"Renan Paiva Oliveira Costa, Diego Damasceno Bispo da Silva, Samuel De Moura Moreira, Daniel Faustino Lacerda de Souza, R. Costa, Tiago Maritan Ugulino de Araújo\",\"doi\":\"10.18265/2447-9187a2022id8053\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Os modelos recentes de Neural Machine Translation (NMT) podem ser aplicados a idiomas e domínios de poucos recursos sem limitações. Alguns trabalhos investigam se novas técnicas de NMT também podem ser generalizadas para diferentes recursos no que diz respeito à disponibilidade de dados e recursos computacionais. Nesse contexto, o objetivo geral deste estudo foi explorar métodos modernos de NMT e analisar a sua potencial aplicabilidade em contextos de poucos recursos, como é o caso das línguas de sinais. Para uma melhor avaliação, foram adaptados e utilizados alguns modelos promissores identificados no componente de tradução automática da Suíte VLibras e os resultados obtidos foram comparados com aqueles atualmente fornecidos pela atual arquitetura LightConv, sendo utilizado o mesmo corpus bilíngue Português-LIBRAS de treinamento e validação com mais de 70.000 sentenças geradas por linguístas, um dos maiores desse tipo disponíveis no mundo. Os resultados indicam que a adoção de uma das duas arquiteturas de melhor desempenho (Basic Transformer ou ByT5) ajudaria a melhorar a precisão e a qualidade da tradução da Suite VLibras, com um aumento percentual de até 12,73% considerando a métrica BLEU.\",\"PeriodicalId\":21386,\"journal\":{\"name\":\"Revista Principia - Divulgação Científica e Tecnológica do IFPB\",\"volume\":\" 10\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-01-12\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista Principia - Divulgação Científica e Tecnológica do IFPB\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.18265/2447-9187a2022id8053\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Principia - Divulgação Científica e Tecnológica do IFPB","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18265/2447-9187a2022id8053","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

最新的神经机器翻译（NMT）模型可以毫无限制地应用于低资源语言和领域。一些研究工作探讨了新的 NMT 技术是否也能适用于数据可用性和计算资源方面的不同资源。在此背景下，本研究的总体目标是探索现代 NMT 方法，并分析其在低资源环境（如手语）中的潜在适用性。为了更好地进行评估，我们改编并使用了 VLibras Suite 机器翻译组件中确定的一些有前途的模型，并将所获得的结果与当前 LightConv 架构提供的结果进行了比较，使用的是相同的葡萄牙语-LIBRAS 双语训练和验证语料库，该语料库由语言学家生成，包含 70,000 多个句子，是目前世界上最大的同类语料库之一。结果表明，采用两种性能最好的架构之一（Basic Transformer 或 ByT5）将有助于提高 VLibras Suite 翻译的准确性和质量，根据 BLEU 指标，可提高 12.73%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

Avaliação do uso de modelos de aprendizagem profunda na tradução automática de línguas de sinais

Os modelos recentes de Neural Machine Translation (NMT) podem ser aplicados a idiomas e domínios de poucos recursos sem limitações. Alguns trabalhos investigam se novas técnicas de NMT também podem ser generalizadas para diferentes recursos no que diz respeito à disponibilidade de dados e recursos computacionais. Nesse contexto, o objetivo geral deste estudo foi explorar métodos modernos de NMT e analisar a sua potencial aplicabilidade em contextos de poucos recursos, como é o caso das línguas de sinais. Para uma melhor avaliação, foram adaptados e utilizados alguns modelos promissores identificados no componente de tradução automática da Suíte VLibras e os resultados obtidos foram comparados com aqueles atualmente fornecidos pela atual arquitetura LightConv, sendo utilizado o mesmo corpus bilíngue Português-LIBRAS de treinamento e validação com mais de 70.000 sentenças geradas por linguístas, um dos maiores desse tipo disponíveis no mundo. Os resultados indicam que a adoção de uma das duas arquiteturas de melhor desempenho (Basic Transformer ou ByT5) ajudaria a melhorar a precisão e a qualidade da tradução da Suite VLibras, com um aumento percentual de até 12,73% considerando a métrica BLEU.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Revista Principia - Divulgação Científica e Tecnológica do IFPB

自引率

0.00%

发文量