一般预训练机器学习模型的性能分析:BERT vs DistilBERT

Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022) Pub Date : 2022-05-23 DOI:10.5753/sbrc_estendido.2022.223391

R. Barbon, A. T. Akabane

{"title":"一般预训练机器学习模型的性能分析:BERT vs DistilBERT","authors":"R. Barbon, A. T. Akabane","doi":"10.5753/sbrc_estendido.2022.223391","DOIUrl":null,"url":null,"abstract":"Modelos de aprendizado de máquina (AM) vêm sendo amplamente utilizados devido à elevada quantidade de dados produzidos diariamente. Dentre eles, destaca-se os modelos pré-treinados devido a sua eficácia, porém estes normalmente demandam um elevado custo computacional na execução de sua tarefa. A fim de contornar esse problema, técnicas de compressão de redes neurais vem sendo aplicadas para produzir modelos pré-treinados menores sem comprometer a acurácia. Com isso, neste trabalho foram utilizados dois diferentes modelos pré-treinados de AM: BERT e DistilBERT na classificação de texto. Os resultados apontam que modelos menores apresentam bons resultados quando comparados com seus equivalentes maiores.","PeriodicalId":365067,"journal":{"name":"Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)","volume":"278 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-05-23","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Análise de Performance dos Modelos Gerais de Aprendizado de Máquina Pré-Treinados: BERT vs DistilBERT\",\"authors\":\"R. Barbon, A. T. Akabane\",\"doi\":\"10.5753/sbrc_estendido.2022.223391\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Modelos de aprendizado de máquina (AM) vêm sendo amplamente utilizados devido à elevada quantidade de dados produzidos diariamente. Dentre eles, destaca-se os modelos pré-treinados devido a sua eficácia, porém estes normalmente demandam um elevado custo computacional na execução de sua tarefa. A fim de contornar esse problema, técnicas de compressão de redes neurais vem sendo aplicadas para produzir modelos pré-treinados menores sem comprometer a acurácia. Com isso, neste trabalho foram utilizados dois diferentes modelos pré-treinados de AM: BERT e DistilBERT na classificação de texto. Os resultados apontam que modelos menores apresentam bons resultados quando comparados com seus equivalentes maiores.\",\"PeriodicalId\":365067,\"journal\":{\"name\":\"Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)\",\"volume\":\"278 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-05-23\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/sbrc_estendido.2022.223391\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbrc_estendido.2022.223391","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

机器学习模型由于每天产生大量的数据而被广泛使用。其中，预训练模型由于其有效性而脱颖而出，但它们在执行任务时通常需要很高的计算成本。为了解决这个问题，神经网络压缩技术被应用于生成更小的预训练模型而不影响精度。因此，本研究采用两种不同的预训练模型:BERT和DistilBERT进行文本分类。结果表明，较小的模型与较大的模型相比表现出良好的结果。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

Análise de Performance dos Modelos Gerais de Aprendizado de Máquina Pré-Treinados: BERT vs DistilBERT

Modelos de aprendizado de máquina (AM) vêm sendo amplamente utilizados devido à elevada quantidade de dados produzidos diariamente. Dentre eles, destaca-se os modelos pré-treinados devido a sua eficácia, porém estes normalmente demandam um elevado custo computacional na execução de sua tarefa. A fim de contornar esse problema, técnicas de compressão de redes neurais vem sendo aplicadas para produzir modelos pré-treinados menores sem comprometer a acurácia. Com isso, neste trabalho foram utilizados dois diferentes modelos pré-treinados de AM: BERT e DistilBERT na classificação de texto. Os resultados apontam que modelos menores apresentam bons resultados quando comparados com seus equivalentes maiores.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Anais Estendidos do XL Simpósio Brasileiro de Redes de Computadores e Sistemas Distribuídos (SBRC Estendido 2022)

自引率

0.00%

发文量