Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227582
Tiago Madeira, D. Mauá
In this work, we leverage the relation between Sum-Product Networks (SPNs) and Gaussian mixtures to propose an algorithm that adapts the Expectation-Maximization method to efficiently find the modes of SPNs with Gaussian leaves. We discuss how the algorithm can be used to perform Maximum-A-Posteriori inference in SPNs learned from continuous data with theoretical advantages over the existing methods in the literature, and how it can be used to shrink the size of learned models. As an additional example of the use of the algorithm, we perform an SPN-based hierarchical clustering of digit images. Thus, our proposed algorithm can be used for model analysis, model compression, and exploratory data analysis.
{"title":"Tractable Mode-Finding in Sum-Product Networks with Gaussian Leaves","authors":"Tiago Madeira, D. Mauá","doi":"10.5753/eniac.2022.227582","DOIUrl":"https://doi.org/10.5753/eniac.2022.227582","url":null,"abstract":"In this work, we leverage the relation between Sum-Product Networks (SPNs) and Gaussian mixtures to propose an algorithm that adapts the Expectation-Maximization method to efficiently find the modes of SPNs with Gaussian leaves. We discuss how the algorithm can be used to perform Maximum-A-Posteriori inference in SPNs learned from continuous data with theoretical advantages over the existing methods in the literature, and how it can be used to shrink the size of learned models. As an additional example of the use of the algorithm, we perform an SPN-based hierarchical clustering of digit images. Thus, our proposed algorithm can be used for model analysis, model compression, and exploratory data analysis.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"219 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124326849","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227595
Arthur F. Dornelas, L. D. Campos, Karla Figueiredo
O ICMS (Imposto sobre Circulação de Mercadorias e Prestação de Serviços de Transporte Interestadual e Intermunicipal e de Comunicação) é um dos principais impostos arrecadados pelos estados brasileiros, sendo seu valor importante na gestão e planejamento do governo, em especial para o estado do Rio de Janeiro, que se apresenta em crise econômica e desde o ano 2020 está em Regime de Recuperação Fiscal, necessitando de uma constante atualização da previsão de seus valores de receita e gastos. Devido às incertezas e mudanças externas e internas no estado carioca, a previsão desse valor coletado possui característica de não-linearidade, sendo necessário a aplicação de modelos não lineares que possam considerar essas mudanças nos valores arrecadados ao longo do tempo. Por conseguinte, o trabalho aqui descrito visa utilizar modelos de Redes Neurais Recorrentes Long Short-Term Memory (LSTM) e comparar as abordagens Multivariate Multi-step e Univariate Multi-step, na tentativa de gerar uma previsão anual da arrecadação tributária do estado superior à de outras abordagens, podendo ser utilizados como parâmetros para a tomada de decisões das autoridades governamentais.
{"title":"Modelos para Previsão Tributária Utilizando Redes Neurais LSTM","authors":"Arthur F. Dornelas, L. D. Campos, Karla Figueiredo","doi":"10.5753/eniac.2022.227595","DOIUrl":"https://doi.org/10.5753/eniac.2022.227595","url":null,"abstract":"O ICMS (Imposto sobre Circulação de Mercadorias e Prestação de Serviços de Transporte Interestadual e Intermunicipal e de Comunicação) é um dos principais impostos arrecadados pelos estados brasileiros, sendo seu valor importante na gestão e planejamento do governo, em especial para o estado do Rio de Janeiro, que se apresenta em crise econômica e desde o ano 2020 está em Regime de Recuperação Fiscal, necessitando de uma constante atualização da previsão de seus valores de receita e gastos. Devido às incertezas e mudanças externas e internas no estado carioca, a previsão desse valor coletado possui característica de não-linearidade, sendo necessário a aplicação de modelos não lineares que possam considerar essas mudanças nos valores arrecadados ao longo do tempo. Por conseguinte, o trabalho aqui descrito visa utilizar modelos de Redes Neurais Recorrentes Long Short-Term Memory (LSTM) e comparar as abordagens Multivariate Multi-step e Univariate Multi-step, na tentativa de gerar uma previsão anual da arrecadação tributária do estado superior à de outras abordagens, podendo ser utilizados como parâmetros para a tomada de decisões das autoridades governamentais.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"72 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126338721","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227571
Marcus Almeida, M. Mota, Wellington Souza, Marcos Nicolau, E. Luz, G. Moreira
Modelos de previsão de desligamento de clientes visam detectar clientes com alta probabilidade de cancelamento do contrato, com base no uso dos serviços oferecidos. Propomos uma abordagem temporal para a etapa de rotulagem, baseada na redução da frequência de uso dos serviços, por meio do comportamento de cada cliente. Também propomos uma arquitetura de rede neural temporal para a tarefa. A abordagem foi avaliada em um conjunto de dados reais, fornecido por uma empresa brasileira do setor financeiro. A rede neural convolucional temporal alcançou uma acurácia de 82, 63%, uma sensibilidade de 61, 5% e uma precisão de 41, 58%, superando outros classificadores tradicionais (XG-Boost e Floresta Aleatória).
{"title":"A Temporal Approach to Customer Churn Prediction: A Case Study for Financial Services","authors":"Marcus Almeida, M. Mota, Wellington Souza, Marcos Nicolau, E. Luz, G. Moreira","doi":"10.5753/eniac.2022.227571","DOIUrl":"https://doi.org/10.5753/eniac.2022.227571","url":null,"abstract":"Modelos de previsão de desligamento de clientes visam detectar clientes com alta probabilidade de cancelamento do contrato, com base no uso dos serviços oferecidos. Propomos uma abordagem temporal para a etapa de rotulagem, baseada na redução da frequência de uso dos serviços, por meio do comportamento de cada cliente. Também propomos uma arquitetura de rede neural temporal para a tarefa. A abordagem foi avaliada em um conjunto de dados reais, fornecido por uma empresa brasileira do setor financeiro. A rede neural convolucional temporal alcançou uma acurácia de 82, 63%, uma sensibilidade de 61, 5% e uma precisão de 41, 58%, superando outros classificadores tradicionais (XG-Boost e Floresta Aleatória).","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"5 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128042341","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227413
Lucas F. Buzuti, T. Heiderich, C.E.P. Thomaz
Redes Adversárias Generativas (GANs) estão sendo cada vez mais usadas para gerar artificialmente vários tipos de dados. O treinamento dessas redes requer um conjunto de dados suficientemente grande e se torna um desafio com pequenos conjuntos. Trabalhos recentes propuseram novas abordagens para o treinamento de GANs com poucas amostras. Este trabalho analisa a distribuição espacial dos dados reais e sintéticos desses conjuntos, construindo subespaços de forma aleatória e variando o nível de espalhamento. Para variar o nível de espalhamento, este trabalho propõe o algoritmo k-Amostras Esparsas. Os resultados mostraram que pequenos conjuntos com uma distribuição espacial mais espalhada tendem a gerar dados com mais diversidade.
{"title":"Spatial Distribution Analysis of Images in GAN Training with Small Datasets","authors":"Lucas F. Buzuti, T. Heiderich, C.E.P. Thomaz","doi":"10.5753/eniac.2022.227413","DOIUrl":"https://doi.org/10.5753/eniac.2022.227413","url":null,"abstract":"Redes Adversárias Generativas (GANs) estão sendo cada vez mais usadas para gerar artificialmente vários tipos de dados. O treinamento dessas redes requer um conjunto de dados suficientemente grande e se torna um desafio com pequenos conjuntos. Trabalhos recentes propuseram novas abordagens para o treinamento de GANs com poucas amostras. Este trabalho analisa a distribuição espacial dos dados reais e sintéticos desses conjuntos, construindo subespaços de forma aleatória e variando o nível de espalhamento. Para variar o nível de espalhamento, este trabalho propõe o algoritmo k-Amostras Esparsas. Os resultados mostraram que pequenos conjuntos com uma distribuição espacial mais espalhada tendem a gerar dados com mais diversidade.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131367489","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227610
Ronaldo Lopes Inocêncio Júnior, L. Silveira, Victor Castro Nacif de Faria, Ana Carolina Lorena
O uso de técnicas de Ciência de Dados e Inteligência Artificial permeia diversas áreas críticas hoje em dia. Isso inclui a lei e justiça, onde alguns modelos de decisão baseados em dados dão suporte para determinar o risco de reincidência de condenados. Este artigo analisa os dados de reincidência criminal do conjunto de dados COMPAS com técnicas de Aprendizado de Máquina. Esse conjunto de dados contém dados de criminosos nos EUA e seu risco de reincidência. Especificamente, focamos na justiça das decisões dos modelos gerados a partir desses dados em relação ao atributo de etnia dos indivíduos. Como o viés racial foi encontrado dentro do conjunto de dados como uma consequência da assimetria deste atributo em relação à variável alvo, também experimentamos um balanceamento simples do conjunto de dados em relação ao atributo etnia.
{"title":"Justiça nas previsões de modelos de Aprendizado de Máquina: um estudo de caso com dados de reincidência criminal","authors":"Ronaldo Lopes Inocêncio Júnior, L. Silveira, Victor Castro Nacif de Faria, Ana Carolina Lorena","doi":"10.5753/eniac.2022.227610","DOIUrl":"https://doi.org/10.5753/eniac.2022.227610","url":null,"abstract":"O uso de técnicas de Ciência de Dados e Inteligência Artificial permeia diversas áreas críticas hoje em dia. Isso inclui a lei e justiça, onde alguns modelos de decisão baseados em dados dão suporte para determinar o risco de reincidência de condenados. Este artigo analisa os dados de reincidência criminal do conjunto de dados COMPAS com técnicas de Aprendizado de Máquina. Esse conjunto de dados contém dados de criminosos nos EUA e seu risco de reincidência. Especificamente, focamos na justiça das decisões dos modelos gerados a partir desses dados em relação ao atributo de etnia dos indivíduos. Como o viés racial foi encontrado dentro do conjunto de dados como uma consequência da assimetria deste atributo em relação à variável alvo, também experimentamos um balanceamento simples do conjunto de dados em relação ao atributo etnia.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124834324","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227594
José Ilmar Cruz Freire Neto, André Britto
Hyperparameters affects the performance of machine learning models. Hyperparameter optimization is an area that aims to find the best of them, but it deals with a considerable number of machine learning training, which can be slow. Thus, surrogates can be used to soften this slow process. This paper evaluates the performance of two surrogate methods, M1 and MARSAOP, applied to hyperparameter optimization. The surrogates are confronted with six hyperparameter optimization algorithms from the literature for classification and regression problems. Results indicate that the surrogate methods are faster than the traditional algorithms.
{"title":"Surrogate Methods Applied to Hyperparameter Optimization Problem","authors":"José Ilmar Cruz Freire Neto, André Britto","doi":"10.5753/eniac.2022.227594","DOIUrl":"https://doi.org/10.5753/eniac.2022.227594","url":null,"abstract":"Hyperparameters affects the performance of machine learning models. Hyperparameter optimization is an area that aims to find the best of them, but it deals with a considerable number of machine learning training, which can be slow. Thus, surrogates can be used to soften this slow process. This paper evaluates the performance of two surrogate methods, M1 and MARSAOP, applied to hyperparameter optimization. The surrogates are confronted with six hyperparameter optimization algorithms from the literature for classification and regression problems. Results indicate that the surrogate methods are faster than the traditional algorithms.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"70 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121288954","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227624
Eduardo Henrique Próspero Souza, K. S. Komati
O objetivo deste artigo é analisar o resultado da acurácia de classificação de tipos de granito, de acordo com a variação da quantidade de camadas convolucionais de uma CNN. A partir de uma arquitetura padrão de CNN, varia-se apenas a quantidade de camadas convolucionais, iniciando com 2 camadas até 10 camadas, incrementando uma camada a cada experimento. Foi usada uma base de dados pública, a Rock Image Datasets. Ao final, a arquitetura com 5 camadas convolucionais foi a que alcançou os melhores resultados, chegando a 99% de acurácia.
{"title":"How many Convolutional Layers are required for a Granite Classification Neural Network?","authors":"Eduardo Henrique Próspero Souza, K. S. Komati","doi":"10.5753/eniac.2022.227624","DOIUrl":"https://doi.org/10.5753/eniac.2022.227624","url":null,"abstract":"O objetivo deste artigo é analisar o resultado da acurácia de classificação de tipos de granito, de acordo com a variação da quantidade de camadas convolucionais de uma CNN. A partir de uma arquitetura padrão de CNN, varia-se apenas a quantidade de camadas convolucionais, iniciando com 2 camadas até 10 camadas, incrementando uma camada a cada experimento. Foi usada uma base de dados pública, a Rock Image Datasets. Ao final, a arquitetura com 5 camadas convolucionais foi a que alcançou os melhores resultados, chegando a 99% de acurácia.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"108 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122331516","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227178
Fábio Cordeiro, R. A. L. Rabelo, R. Moura
O objetivo deste trabalho é avaliar modelos de Aprendizado de Máquina (AM) na tarefa de classificação de comunicados de irregularidades em Ouvidorias Públicas de Tribunais de Contas. De maneira geral, pretendese contribuir de forma efetiva para melhorar a triagem desses comunicados, possibilitando maior celeridade na resposta ao cidadão. Devido ao desbalanceamento do dataset original, foram aplicadas técnicas de redimensionamento de dados antes da etapa de treinamento dos modelos. Algoritmos clássicos de Machine Learning (Naive Bayes, Decision Tree, Random Forest, K Nearest Neighbor e Support Vector Machine) foram comparados com o modelo de Deep Learning Bidirectional Encoder Representations from Transformers (BERT) e variações de representação dos textos com Word Embeddings. Os melhores resultados foram obtidos pelo modelo BERT com o dataset redimensionado, atingindo 96% na métrica F1-Score.
{"title":"Classification of Irregularity Communications in Public Ombudsmen Using Supervised Learning Algorithms","authors":"Fábio Cordeiro, R. A. L. Rabelo, R. Moura","doi":"10.5753/eniac.2022.227178","DOIUrl":"https://doi.org/10.5753/eniac.2022.227178","url":null,"abstract":"O objetivo deste trabalho é avaliar modelos de Aprendizado de Máquina (AM) na tarefa de classificação de comunicados de irregularidades em Ouvidorias Públicas de Tribunais de Contas. De maneira geral, pretendese contribuir de forma efetiva para melhorar a triagem desses comunicados, possibilitando maior celeridade na resposta ao cidadão. Devido ao desbalanceamento do dataset original, foram aplicadas técnicas de redimensionamento de dados antes da etapa de treinamento dos modelos. Algoritmos clássicos de Machine Learning (Naive Bayes, Decision Tree, Random Forest, K Nearest Neighbor e Support Vector Machine) foram comparados com o modelo de Deep Learning Bidirectional Encoder Representations from Transformers (BERT) e variações de representação dos textos com Word Embeddings. Os melhores resultados foram obtidos pelo modelo BERT com o dataset redimensionado, atingindo 96% na métrica F1-Score.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129792635","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227591
Raimundo Juracy Campos Ferro Junior, G. A. L. Campos
Um dos desafios no contexto do estudo de processos de evacuação e situações de resgate é a falta de estudos e ferramentas que contemplem evacuantes dependentes ou a possibilidade de simular diferentes estratégias de resgate. Este trabalho visa preencher essa lacuna. Propondo uma arquitetura baseada em agentes que pode produzir dados, treinar algoritmos de regressão para fazer previsões sobre cenários de evacuação horizontal com evacuantes dependentes e propor estratégias de resgate. Os algoritmos de árvore de decisão e rede perceptron multicamadas apresentaram o melhor resultado para a regressão do tempo de evacuação e o modelo de floresta-aleatória conseguiu atingir uma acurácia de 92% ao classificar os cenários com base na estratégia mais adequada para a equipe de resgate.
{"title":"Previsão do tempo de evacuação e recomendação de estratégias de resgate em cenários de evacuação horizontal com evacuadores enfraquecidos","authors":"Raimundo Juracy Campos Ferro Junior, G. A. L. Campos","doi":"10.5753/eniac.2022.227591","DOIUrl":"https://doi.org/10.5753/eniac.2022.227591","url":null,"abstract":"Um dos desafios no contexto do estudo de processos de evacuação e situações de resgate é a falta de estudos e ferramentas que contemplem evacuantes dependentes ou a possibilidade de simular diferentes estratégias de resgate. Este trabalho visa preencher essa lacuna. Propondo uma arquitetura baseada em agentes que pode produzir dados, treinar algoritmos de regressão para fazer previsões sobre cenários de evacuação horizontal com evacuantes dependentes e propor estratégias de resgate. Os algoritmos de árvore de decisão e rede perceptron multicamadas apresentaram o melhor resultado para a regressão do tempo de evacuação e o modelo de floresta-aleatória conseguiu atingir uma acurácia de 92% ao classificar os cenários com base na estratégia mais adequada para a equipe de resgate.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"14 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130002599","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2022-11-28DOI: 10.5753/eniac.2022.227318
Vicente Sampaio, F. Cordeiro
Nos últimos anos, modelos de aprendizado fracamente supervisionado têm auxiliado na detecção de lesões em imagens de mamografia, diminuindo a necessidade de anotações de pixels na imagem. A maioria dos modelos na literatura se baseia no uso de mapas de ativação CAM, não sendo explorado o uso de outros modelos de ativação para detecção em imagens de mamografia. Este trabalho apresenta um estudo do uso de diferentes métodos de mapas de ativação do estado da arte, aplicados para treinamento fracamente supervisionado em imagens de mamografia. Neste estudo, comparamos os métodos CAM, GradCAM, GradCAM++, XGradCAM e LayerCAM, utilizando a rede GMIC para detectar a presença de lesões em imagens de mamografia. A avaliação é feita utilizando a base VinDr-Mammo, utilizando as métricas de Acurácia, TPR, FNR e FPPI. Resultados mostram que o uso de diferentes estratégias de mapas de ativação nas etapas de treino e teste melhoram o resultado do modelo. Com isso, melhoramos os resultados do método GMIC, reduzindo o valor de FPPI e aumentando o valor de TPR.
{"title":"A Study on Class Activation Map Methods to Detect Masses in Mammography Images using Weakly Supervised Learning","authors":"Vicente Sampaio, F. Cordeiro","doi":"10.5753/eniac.2022.227318","DOIUrl":"https://doi.org/10.5753/eniac.2022.227318","url":null,"abstract":"Nos últimos anos, modelos de aprendizado fracamente supervisionado têm auxiliado na detecção de lesões em imagens de mamografia, diminuindo a necessidade de anotações de pixels na imagem. A maioria dos modelos na literatura se baseia no uso de mapas de ativação CAM, não sendo explorado o uso de outros modelos de ativação para detecção em imagens de mamografia. Este trabalho apresenta um estudo do uso de diferentes métodos de mapas de ativação do estado da arte, aplicados para treinamento fracamente supervisionado em imagens de mamografia. Neste estudo, comparamos os métodos CAM, GradCAM, GradCAM++, XGradCAM e LayerCAM, utilizando a rede GMIC para detectar a presença de lesões em imagens de mamografia. A avaliação é feita utilizando a base VinDr-Mammo, utilizando as métricas de Acurácia, TPR, FNR e FPPI. Resultados mostram que o uso de diferentes estratégias de mapas de ativação nas etapas de treino e teste melhoram o resultado do modelo. Com isso, melhoramos os resultados do método GMIC, reduzindo o valor de FPPI e aumentando o valor de TPR.","PeriodicalId":165095,"journal":{"name":"Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)","volume":"22 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2022-11-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126037740","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}