Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229501
Pedro Henrique Tonidandel, Ronan Assumpção Silva, André Luiz Brun
Dentre as técnicas para auxiliar no processo de detecção de doenças, podemos citar a Classificação, que consiste em rotular uma instância baseada nas categorias já conhecidas do problema investigado. Nesta proposta, consideramos a detecção do câncer de mama como um problema de Classificação. Usamos Sistemas de Múltiplos Classificadores, para gerar diversos classificadores, funcionando como especialistas computacionais análoga a consulta com diversos especialistas da área da saúde. A partir da opinião dos especialistas foi criada uma metabase do problema, que, ao ser tratada como um novo problema de classificação, permitiu avaliar padrões nas opiniões que afetam o acerto na rotulação. A proposta tem aumentado o acerto de outras técnicas da literatura considerando a média em ≈ 15 pontos percentuais.
{"title":"Meta aprendizado aplicado ao câncer de mama","authors":"Pedro Henrique Tonidandel, Ronan Assumpção Silva, André Luiz Brun","doi":"10.5753/erbd.2023.229501","DOIUrl":"https://doi.org/10.5753/erbd.2023.229501","url":null,"abstract":"Dentre as técnicas para auxiliar no processo de detecção de doenças, podemos citar a Classificação, que consiste em rotular uma instância baseada nas categorias já conhecidas do problema investigado. Nesta proposta, consideramos a detecção do câncer de mama como um problema de Classificação. Usamos Sistemas de Múltiplos Classificadores, para gerar diversos classificadores, funcionando como especialistas computacionais análoga a consulta com diversos especialistas da área da saúde. A partir da opinião dos especialistas foi criada uma metabase do problema, que, ao ser tratada como um novo problema de classificação, permitiu avaliar padrões nas opiniões que afetam o acerto na rotulação. A proposta tem aumentado o acerto de outras técnicas da literatura considerando a média em ≈ 15 pontos percentuais.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"74 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131360005","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229429
Otávio Thomas Bertucini, Rita C. G. Berardi, Mateus G. Belizario, Nádia P. Kozievitch
As cidades inteligentes são um contexto que pode obter grande vantagem no formato e no crescimento de dados na web semântica, visto que o volume e a conexão aumentam a qualidade das análises de dados. No entanto, o crescimento quantitativo de dados deve acontecer com garantia de qualidade. Este trabalho tem como objetivo a verificação de qualidade de dados na fusão de dados conectados, por meio das dimensões de qualidade acurácia, consistência e concisão. Para especificar as restrições de qualidade a serem verificadas foi utilizada a linguagem SHACL (Shapes Constraint Language) e para a execução da verificação foi criado um script em Python. Os testes foram realizados em um conjunto de dados abertos conectados do domínio de mobilidade urbana e educação na cidade de Curitiba.
{"title":"Garantindo a Qualidade de Dados na Fusão de Dados Conectados: Um caso de uso de SHACL em dados abertos de Mobilidade e Educação de Curitiba","authors":"Otávio Thomas Bertucini, Rita C. G. Berardi, Mateus G. Belizario, Nádia P. Kozievitch","doi":"10.5753/erbd.2023.229429","DOIUrl":"https://doi.org/10.5753/erbd.2023.229429","url":null,"abstract":"As cidades inteligentes são um contexto que pode obter grande vantagem no formato e no crescimento de dados na web semântica, visto que o volume e a conexão aumentam a qualidade das análises de dados. No entanto, o crescimento quantitativo de dados deve acontecer com garantia de qualidade. Este trabalho tem como objetivo a verificação de qualidade de dados na fusão de dados conectados, por meio das dimensões de qualidade acurácia, consistência e concisão. Para especificar as restrições de qualidade a serem verificadas foi utilizada a linguagem SHACL (Shapes Constraint Language) e para a execução da verificação foi criado um script em Python. Os testes foram realizados em um conjunto de dados abertos conectados do domínio de mobilidade urbana e educação na cidade de Curitiba.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"45 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130926583","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229441
Eduardo Darrazão, Victor Amorim, K. Oliveira, Luiz Gomes-Jr
A correta identificação dos elementos constantes em notas fiscais eletrônicas é importante para diversas questões de fiscalização e transparência governamental, como identificação de sobrepreço em licitações públicas. Porém, esta identificação é um desafio tanto pela diversidade de produtos, quanto pelas variações e erros de preenchimento. Este artigo aplica técnicas de estado-da-arte em extração de informação para avaliar os melhores conjuntos de features para se aplicar em notas fiscais eletrônicas brasileiras. Os testes utilizaram dados de notas fiscais de medicamentos emitidas no Piauí em 2021.
{"title":"Engenharia e Avaliação de Features para Extração de Informação em Notas Fiscais","authors":"Eduardo Darrazão, Victor Amorim, K. Oliveira, Luiz Gomes-Jr","doi":"10.5753/erbd.2023.229441","DOIUrl":"https://doi.org/10.5753/erbd.2023.229441","url":null,"abstract":"A correta identificação dos elementos constantes em notas fiscais eletrônicas é importante para diversas questões de fiscalização e transparência governamental, como identificação de sobrepreço em licitações públicas. Porém, esta identificação é um desafio tanto pela diversidade de produtos, quanto pelas variações e erros de preenchimento. Este artigo aplica técnicas de estado-da-arte em extração de informação para avaliar os melhores conjuntos de features para se aplicar em notas fiscais eletrônicas brasileiras. Os testes utilizaram dados de notas fiscais de medicamentos emitidas no Piauí em 2021.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"360 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122769826","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229233
Alejandro R. Gorríz, M. G. Luz, Nádia P. Kozievitch, Marcelo Rosa
As Unidades de Pronto Socorro (UPAs) em Curitiba são um dos pilares da saúde dos cidadãos da cidade. As UPAs atendem uma grande quantidade de pacientes, alcançando até 169 atendimentos diários em algumas unidades. Para facilitar o acesso ao cidadão, é importante que estas sejam alimentadas pela rede de transporte público. O objetivo deste trabalho é realizar uma análise exploratória dos pacientes que frequentam as nove UPAs curitibanas 24 horas e as linhas de ônibus em Curitiba que às atendem. Dentre os resultados, podemos citar que há uma distribuição não homogênea de atendimentos e linhas de ônibus que as atendem.
{"title":"Mobilidade e Saúde: O Caso do Atendimento em UPAs 24 Horas em Curitiba","authors":"Alejandro R. Gorríz, M. G. Luz, Nádia P. Kozievitch, Marcelo Rosa","doi":"10.5753/erbd.2023.229233","DOIUrl":"https://doi.org/10.5753/erbd.2023.229233","url":null,"abstract":"As Unidades de Pronto Socorro (UPAs) em Curitiba são um dos pilares da saúde dos cidadãos da cidade. As UPAs atendem uma grande quantidade de pacientes, alcançando até 169 atendimentos diários em algumas unidades. Para facilitar o acesso ao cidadão, é importante que estas sejam alimentadas pela rede de transporte público. O objetivo deste trabalho é realizar uma análise exploratória dos pacientes que frequentam as nove UPAs curitibanas 24 horas e as linhas de ônibus em Curitiba que às atendem. Dentre os resultados, podemos citar que há uma distribuição não homogênea de atendimentos e linhas de ônibus que as atendem.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"52 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124616118","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229428
Samuel L. B. Bispo, Raqueline R. M. Penteado
Esse artigo apresenta um estudo de caso sobre o processamento federado de consultas na engine FederatedX do SGBD MariaDB. O ponto central do estudo foi a otimização de consultas, mais especificamente, a minimização do tempo de processamento. O estudo considerou dois pontos, sendo eles: i) a definição do modelo lógico e ii) o mecanismo de indexação de dados. Os resultados do estudo mostraram que a definição do modelo lógico foi essencial para a redução do tempo de processamento. Em contrapartida, o mesmo não ocorreu com a indexação.
{"title":"Estudo de caso sobre o processamento de consultas com a engine FederatedX","authors":"Samuel L. B. Bispo, Raqueline R. M. Penteado","doi":"10.5753/erbd.2023.229428","DOIUrl":"https://doi.org/10.5753/erbd.2023.229428","url":null,"abstract":"Esse artigo apresenta um estudo de caso sobre o processamento federado de consultas na engine FederatedX do SGBD MariaDB. O ponto central do estudo foi a otimização de consultas, mais especificamente, a minimização do tempo de processamento. O estudo considerou dois pontos, sendo eles: i) a definição do modelo lógico e ii) o mecanismo de indexação de dados. Os resultados do estudo mostraram que a definição do modelo lógico foi essencial para a redução do tempo de processamento. Em contrapartida, o mesmo não ocorreu com a indexação.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"45 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116417577","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229494
Maicon Brandão, Marcelo Acordi, Guilherme Dal Bianco
Métodos supervisionados são comumente utilizados em inúmeras tarefas como na classificação de informações. Porém, a aprendizagem do método supervisionado depende da criação de um conjunto de treinamento rotulado capaz de representar os padrões presentes na base de dados. Identificar exemplos informativos e representativos pode representar uma redução de custos. Neste contexto, a aprendizagem ativa tem como objetivo selecionar instâncias mais informativas para serem rotuladas a fim de se reduzir o conjunto de treinamento. Este artigo tem como objetivo propor pesos para um algoritmo de aprendizagem ativa para reduzir a quantidade de instâncias selecionadas. Em outras palavras, almeja-se reduzir o impacto do desbalanceamento de classes a partir da utilização de pesos para o método de aprendizagem ativa. Os experimentos preliminares demonstraram que é possível reduzir o tamanho do conjunto rotulado sem impactar na eficácia do método.
{"title":"Uma Proposta para Redução do Conjunto de Treinamento Utilizando Aprendizagem Ativa","authors":"Maicon Brandão, Marcelo Acordi, Guilherme Dal Bianco","doi":"10.5753/erbd.2023.229494","DOIUrl":"https://doi.org/10.5753/erbd.2023.229494","url":null,"abstract":"Métodos supervisionados são comumente utilizados em inúmeras tarefas como na classificação de informações. Porém, a aprendizagem do método supervisionado depende da criação de um conjunto de treinamento rotulado capaz de representar os padrões presentes na base de dados. Identificar exemplos informativos e representativos pode representar uma redução de custos. Neste contexto, a aprendizagem ativa tem como objetivo selecionar instâncias mais informativas para serem rotuladas a fim de se reduzir o conjunto de treinamento. Este artigo tem como objetivo propor pesos para um algoritmo de aprendizagem ativa para reduzir a quantidade de instâncias selecionadas. Em outras palavras, almeja-se reduzir o impacto do desbalanceamento de classes a partir da utilização de pesos para o método de aprendizagem ativa. Os experimentos preliminares demonstraram que é possível reduzir o tamanho do conjunto rotulado sem impactar na eficácia do método.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"55 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126667271","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229497
Alcides de V. A. Júnior, M. Costa, M. G. Luz, Nádia P. Kozievitch
Em muitas cidades, a distribuição da atividade econômica ocorre de maneira heterogênea, de forma que ruas concentram mais estabelecimentos de tipos específicos do que de outros. O objetivo deste trabalho é verificar se a cidade possui vocações econômicas de acordo com seus bairros e ruas. Com técnicas de geographic information system (GIS) e Banco de Dados, realizou-se a análise dos dados e se forneceu o suporte às principais conclusões. Para isso, dados abertos de alvarás relacionados a pólos gastronônimocos de Curitiba foram utilizados.
{"title":"Vocações Econômicas de Curitiba: Um Estudo a Partir de Uma Base de Dados Aberta","authors":"Alcides de V. A. Júnior, M. Costa, M. G. Luz, Nádia P. Kozievitch","doi":"10.5753/erbd.2023.229497","DOIUrl":"https://doi.org/10.5753/erbd.2023.229497","url":null,"abstract":"Em muitas cidades, a distribuição da atividade econômica ocorre de maneira heterogênea, de forma que ruas concentram mais estabelecimentos de tipos específicos do que de outros. O objetivo deste trabalho é verificar se a cidade possui vocações econômicas de acordo com seus bairros e ruas. Com técnicas de geographic information system (GIS) e Banco de Dados, realizou-se a análise dos dados e se forneceu o suporte às principais conclusões. Para isso, dados abertos de alvarás relacionados a pólos gastronônimocos de Curitiba foram utilizados.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"94 3 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122701972","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229383
André Roberto Ortoncelli, Franciele Beal
This work presents a comparison between the valuation/depreciation prediction results (from one month to another) of vehicles in Brazil considering the combination of four groups of characteristics: i) previous sales; ii) the number of vehicle sales; iii) basic interest rate; and iv) national consumer price index. We create a comparison baseline training a MultiLayer Perceptron Regressor (MLPR) based only on the vehicle’s value in the previous month, and then we train the MLPR by combining the previous vehicle value with combinations of the characteristic groups. Experiments were performed from 2013 to 2022 and evaluated in terms of Mean Squared Error (MSR) and Median Absolute Error (MAE). The combination of characteristics that presented the best MSR for the 2018-2022 period (COVID-19 period) was among the worst from 2014 to 2017. It is possibly concluded that data scientists must periodically adjust parameters according to the current economic conditions to obtain the best automatic forecast results of the monthly valorization/depreciation of vehicles in Brazil.
{"title":"Prediction of monthly vehicle valorization/devaluation in Brazil with a MultiLayer Perceptron Regressor: a case study based on past sales, inflation, and interest rate","authors":"André Roberto Ortoncelli, Franciele Beal","doi":"10.5753/erbd.2023.229383","DOIUrl":"https://doi.org/10.5753/erbd.2023.229383","url":null,"abstract":"This work presents a comparison between the valuation/depreciation prediction results (from one month to another) of vehicles in Brazil considering the combination of four groups of characteristics: i) previous sales; ii) the number of vehicle sales; iii) basic interest rate; and iv) national consumer price index. We create a comparison baseline training a MultiLayer Perceptron Regressor (MLPR) based only on the vehicle’s value in the previous month, and then we train the MLPR by combining the previous vehicle value with combinations of the characteristic groups. Experiments were performed from 2013 to 2022 and evaluated in terms of Mean Squared Error (MSR) and Median Absolute Error (MAE). The combination of characteristics that presented the best MSR for the 2018-2022 period (COVID-19 period) was among the worst from 2014 to 2017. It is possibly concluded that data scientists must periodically adjust parameters according to the current economic conditions to obtain the best automatic forecast results of the monthly valorization/depreciation of vehicles in Brazil.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"16 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130370498","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229510
Mateus R. Figênio, Luiz Gomes-Jr
Este artigo tem como objetivo discutir questões éticas relacionadas ao ChatGPT, um modelo de linguagem de estilo conversacional. A partir de trabalhos correlatos que fundamentam o conceito de Modelos de Linguagem Massivos (LLMs) e que trabalham paradigmas de análise ética e boas práticas para o desenvolvimento de Inteligências Artificiais (IA), exploramos como o ChatGPT perpetua problemas já reconhecidos de LLMs e observamos que sua maior capacidade de generalização aumenta perigos de enviesamento e preconceito. Concluímos reforçando apelos por maiores incentivos à diminuição de esforços por maiores modelos, em favor de esforços por bases de dados melhor documentadas, modelos interpretáveis e por abordagens voltadas ao entendimento de linguagem.
{"title":"Ética na era dos Modelos de Linguagem Massivos (LLMs): um estudo de caso do ChatGPT","authors":"Mateus R. Figênio, Luiz Gomes-Jr","doi":"10.5753/erbd.2023.229510","DOIUrl":"https://doi.org/10.5753/erbd.2023.229510","url":null,"abstract":"Este artigo tem como objetivo discutir questões éticas relacionadas ao ChatGPT, um modelo de linguagem de estilo conversacional. A partir de trabalhos correlatos que fundamentam o conceito de Modelos de Linguagem Massivos (LLMs) e que trabalham paradigmas de análise ética e boas práticas para o desenvolvimento de Inteligências Artificiais (IA), exploramos como o ChatGPT perpetua problemas já reconhecidos de LLMs e observamos que sua maior capacidade de generalização aumenta perigos de enviesamento e preconceito. Concluímos reforçando apelos por maiores incentivos à diminuição de esforços por maiores modelos, em favor de esforços por bases de dados melhor documentadas, modelos interpretáveis e por abordagens voltadas ao entendimento de linguagem.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"52 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133380010","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pub Date : 2023-04-11DOI: 10.5753/erbd.2023.229499
Leonardo da S. Camargo, H. Rocha, L. S. D. Nascimento, Carmem S. Hara
Redes sociais geram dados em grande volume, que são de livre e fácil acesso, renováveis por serem gerados continuamente e em tempo real, e de longa duração. O objetivo deste trabalho é coletar postagens do Instagram para obter dados sobre a distribuição espaço-temporal de avistamentos da caravela-portuguesa (cnidário physalia physalis) na costa brasileira. Foram obtidas postagens do Instagram com informações que apontam o Instagram como uma possível fonte deste tipo de dado, dada a quantidade de postagens coletadas. Trabalhos futuros envolvem determinar a veracidade e abrangência das informações e desenvolvimento de um processo automatizado para periodicamente extrair novas postagens.
{"title":"Coleta de Dados do Instagram sobre Ocorrências de Caravelas-Portuguesas na Costa Brasileira","authors":"Leonardo da S. Camargo, H. Rocha, L. S. D. Nascimento, Carmem S. Hara","doi":"10.5753/erbd.2023.229499","DOIUrl":"https://doi.org/10.5753/erbd.2023.229499","url":null,"abstract":"Redes sociais geram dados em grande volume, que são de livre e fácil acesso, renováveis por serem gerados continuamente e em tempo real, e de longa duração. O objetivo deste trabalho é coletar postagens do Instagram para obter dados sobre a distribuição espaço-temporal de avistamentos da caravela-portuguesa (cnidário physalia physalis) na costa brasileira. Foram obtidas postagens do Instagram com informações que apontam o Instagram como uma possível fonte deste tipo de dado, dada a quantidade de postagens coletadas. Trabalhos futuros envolvem determinar a veracidade e abrangência das informações e desenvolvimento de um processo automatizado para periodicamente extrair novas postagens.","PeriodicalId":442588,"journal":{"name":"Anais da XVIII Escola Regional de Banco de Dados (ERBD 2023)","volume":"30 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2023-04-11","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133508204","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}