Lucas L. Santos, R. A. C. Bianchi, Anna Helena Reali Costa
{"title":"FinBERT-PT-BR: Análise de Sentimentos de Textos em Português do Mercado Financeiro","authors":"Lucas L. Santos, R. A. C. Bianchi, Anna Helena Reali Costa","doi":"10.5753/bwaif.2023.231151","DOIUrl":null,"url":null,"abstract":"Este artigo contribui com um modelo de análise de sentimento para notícias financeiras em língua portuguesa usando a arquitetura de rede neural BERT. O modelo foi treinado em duas etapas: modelagem de linguagem e modelagem de sentimentos, com 1,4 milhão de textos e 500 textos rotulados, respectivamente. O modelo apresentou melhor desempenho do que os modelos atuais do estado da arte em diversas métricas e pode ser usado para construir índices de sentimento, estratégias de investimento e analisar dados macroeconômicos. O estudo demonstra o potencial do processamento de linguagem natural e transformers para finanças quantitativas.","PeriodicalId":101527,"journal":{"name":"Anais do II Brazilian Workshop on Artificial Intelligence in Finance (BWAIF 2023)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-08-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do II Brazilian Workshop on Artificial Intelligence in Finance (BWAIF 2023)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/bwaif.2023.231151","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Este artigo contribui com um modelo de análise de sentimento para notícias financeiras em língua portuguesa usando a arquitetura de rede neural BERT. O modelo foi treinado em duas etapas: modelagem de linguagem e modelagem de sentimentos, com 1,4 milhão de textos e 500 textos rotulados, respectivamente. O modelo apresentou melhor desempenho do que os modelos atuais do estado da arte em diversas métricas e pode ser usado para construir índices de sentimento, estratégias de investimento e analisar dados macroeconômicos. O estudo demonstra o potencial do processamento de linguagem natural e transformers para finanças quantitativas.