Abordagens probabilísticas de tópicos são ferramentas para descobrir e explorar estruturas temáticas escondidas em coleções de textos. Dada uma coleção de documentos, a tarefa de extrair os tópicos consiste em criar um vocabulário a partir da coleção, verificar a probabilidade de cada palavra pertencer a um documento da coleção. Em seguida, baseado no número de tópicos desejado, a probabilidade de cada palavra estar associada a um determinado tópico é contabilizada. Assim, um tópico é um conjunto de palavras ordenadas pela probabilidade de estar associada ao tópico. Várias abordagens são encontradas na literatura para criação de modelos de tópicos, e.g., Hierarchical Dirichlet Process (HDP), Latent Dirichlet Allocation (LDA), Non-Negative Matrix Factorization (NMF) e Dirichlet-multinomial Regression (DMR). Este trabalho procura identificar a qualidade dos tópicos construídos pelas quatro abordagens citadas. A Qualidade será medida por métricas de coerência e todas as abordagens terão a mesma coleção de documentos como entrada: notícias de websites dos jornais Breibart, Business Insider, The Atlantic, CNN e New York Times contendo 50.000 artigos. Os resultados mostram que DMR e LDA são os melhores modelos para extrair tópicos da coleção utilizada.
概率主题方法是发现和探索隐藏在文本集合中的主题结构的工具。给定一个文档集合,提取主题的任务包括从集合中创建一个词汇表,检查每个单词属于集合中的文档的概率。然后,根据所需的主题数量,计算每个单词与给定主题关联的概率。因此,一个主题是一组单词,按与该主题相关的概率排序。在文献中发现了几种创建主题模型的方法,如层次狄利克雷过程(HDP)、潜在狄利克雷分配(LDA)、非负矩阵分解(NMF)和狄利克雷多项回归(DMR)。本研究旨在确定上述四种方法所构建的主题的质量。质量将通过一致性度量来衡量,所有方法都将有相同的文档集作为输入:来自Breibart、Business Insider、The Atlantic、CNN和New York Times网站的新闻,包含5万篇文章。结果表明,DMR和LDA是提取所使用的集合主题的最佳模型。
{"title":"Modelagem Probabilística de Tópicos: Uma Comparação Empírica","authors":"Leonardo H. Rocha, D. Welter, Denio Duarte","doi":"10.5753/erbd.2021.17237","DOIUrl":"https://doi.org/10.5753/erbd.2021.17237","url":null,"abstract":"Abordagens probabilísticas de tópicos são ferramentas para descobrir e explorar estruturas temáticas escondidas em coleções de textos. Dada uma coleção de documentos, a tarefa de extrair os tópicos consiste em criar um vocabulário a partir da coleção, verificar a probabilidade de cada palavra pertencer a um documento da coleção. Em seguida, baseado no número de tópicos desejado, a probabilidade de cada palavra estar associada a um determinado tópico é contabilizada. Assim, um tópico é um conjunto de palavras ordenadas pela probabilidade de estar associada ao tópico. Várias abordagens são encontradas na literatura para criação de modelos de tópicos, e.g., Hierarchical Dirichlet Process (HDP), Latent Dirichlet Allocation (LDA), Non-Negative Matrix Factorization (NMF) e Dirichlet-multinomial Regression (DMR). Este trabalho procura identificar a qualidade dos tópicos construídos pelas quatro abordagens citadas. A Qualidade será medida por métricas de coerência e todas as abordagens terão a mesma coleção de documentos como entrada: notícias de websites dos jornais Breibart, Business Insider, The Atlantic, CNN e New York Times contendo 50.000 artigos. Os resultados mostram que DMR e LDA são os melhores modelos para extrair tópicos da coleção utilizada.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"22 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122713068","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Há uma demanda crescente por dispositivos para coletar e analisar informações relacionadas à geolocalização, incluindo a descoberta de padrões de comovimento de objetos móveis. Entre os padrões de comovimento mais relevantes está o padrão Flock. Um flock é um conjunto de objetos que se movem juntos, definidos por um disco móvel de diâmetro fixo, por um período consecutivo de instantes de tempo. Recentemente, foi proposta uma variação desse padrão, denominada padrão kϵ-Flocks, que dispensa a definição do parâmetro distância. O algoritmo existente para detectar kϵ-Flocks segue uma abordagem top-down, começando por umúnico flock candidato e realizando subdivisões sucessivas até encontrar k flocks com o menor diâmetro possível. Este trabalho propõe um novo algoritmo bottom-up para o problema kϵ-Flocks, baseado no agrupamento iterativo de elementos próximos no espaço até detectar os kϵ-Flocks. O trabalho descreve os fundamentos da solução, discute sua correção e apresenta o algoritmo proposto. Espera-se que o algoritmo proposto seja mais eficiente que o algoritmo top-down em muitos casos típicos.
{"title":"Proposta de Algoritmo por Crescimento Gradativo de Diâmetro para Detecção de k-Flocks em Dados de Trajetórias","authors":"Luan Almeida, Vinicius E. C. Verdade, D. Kaster","doi":"10.5753/erbd.2021.17245","DOIUrl":"https://doi.org/10.5753/erbd.2021.17245","url":null,"abstract":"Há uma demanda crescente por dispositivos para coletar e analisar informações relacionadas à geolocalização, incluindo a descoberta de padrões de comovimento de objetos móveis. Entre os padrões de comovimento mais relevantes está o padrão Flock. Um flock é um conjunto de objetos que se movem juntos, definidos por um disco móvel de diâmetro fixo, por um período consecutivo de instantes de tempo. Recentemente, foi proposta uma variação desse padrão, denominada padrão kϵ-Flocks, que dispensa a definição do parâmetro distância. O algoritmo existente para detectar kϵ-Flocks segue uma abordagem top-down, começando por umúnico flock candidato e realizando subdivisões sucessivas até encontrar k flocks com o menor diâmetro possível. Este trabalho propõe um novo algoritmo bottom-up para o problema kϵ-Flocks, baseado no agrupamento iterativo de elementos próximos no espaço até detectar os kϵ-Flocks. O trabalho descreve os fundamentos da solução, discute sua correção e apresenta o algoritmo proposto. Espera-se que o algoritmo proposto seja mais eficiente que o algoritmo top-down em muitos casos típicos.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"23 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129828601","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Encontrar bugs ou falhas de código em sistemas pode ser uma tarefa extremamente complexa e onerosa. Uma alternativa para diminuir o esforço do usuário é aplicar o Modelo de Previsão de Vulnerabilidade (MPV). Um MPV utiliza técnicas de classificação e aprendizagem ativa para identificar trechos de código com possíveis bugs. Para isso, o MPV depende de um treinamento inicial (arquivos de código contendo bugs) na construção de um modelo de predição. Tal problema, conhecido como partida fria ou cold-start, surge quando o método não tem exemplos representativos para o início do processo. Neste trabalho, o objetivo é avaliar experimentalmente a reutilização de treinamento entre projetos com intuito de aliviar o impacto da partida fria quando se deseja encontrar todos (ou quase todos) arquivos de bug.
{"title":"Um estudo sobre reutilização de treinamento em Modelos de Previsão de Vulnerabilidade","authors":"Matheus Vinícius Todescato, Guilherme Dal Bianco","doi":"10.5753/erbd.2021.17243","DOIUrl":"https://doi.org/10.5753/erbd.2021.17243","url":null,"abstract":"Encontrar bugs ou falhas de código em sistemas pode ser uma tarefa extremamente complexa e onerosa. Uma alternativa para diminuir o esforço do usuário é aplicar o Modelo de Previsão de Vulnerabilidade (MPV). Um MPV utiliza técnicas de classificação e aprendizagem ativa para identificar trechos de código com possíveis bugs. Para isso, o MPV depende de um treinamento inicial (arquivos de código contendo bugs) na construção de um modelo de predição. Tal problema, conhecido como partida fria ou cold-start, surge quando o método não tem exemplos representativos para o início do processo. Neste trabalho, o objetivo é avaliar experimentalmente a reutilização de treinamento entre projetos com intuito de aliviar o impacto da partida fria quando se deseja encontrar todos (ou quase todos) arquivos de bug.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"112 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131734970","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Hoje em dia, redes sociais como o Twitter são usadas não apenas para entretenimento, mas como uma ferramenta de trabalho, seja de cunho político, artístico ou puramente comercial. Muitas das mensagens publicadas são concebidas com cuidado, de modo a fidelizar e ampliar a base de seguidores. Nesse contexto, este trabalho propõe a reescrita de tuítes visando aumentar o seu engajamento. A reescrita proposta substitui adjetivos por sinônimos considerados mais adequados, levando em consideração os adjetivos que são comumente associados à tuítes com alta taxa de engajamento. Os resultados experimentais usando um algoritmo de aprendizado de máquina como avaliador demonstram que o processo de reescrita potencialmente gera tuítes melhores.
{"title":"Um estudo sobre o aprimoramento de tuítes com base na substituição de adjetivos","authors":"Juliano M. Pasa, L. D. Oliveira, S. L. S. Mergen","doi":"10.5753/erbd.2021.17244","DOIUrl":"https://doi.org/10.5753/erbd.2021.17244","url":null,"abstract":"Hoje em dia, redes sociais como o Twitter são usadas não apenas para entretenimento, mas como uma ferramenta de trabalho, seja de cunho político, artístico ou puramente comercial. Muitas das mensagens publicadas são concebidas com cuidado, de modo a fidelizar e ampliar a base de seguidores. Nesse contexto, este trabalho propõe a reescrita de tuítes visando aumentar o seu engajamento. A reescrita proposta substitui adjetivos por sinônimos considerados mais adequados, levando em consideração os adjetivos que são comumente associados à tuítes com alta taxa de engajamento. Os resultados experimentais usando um algoritmo de aprendizado de máquina como avaliador demonstram que o processo de reescrita potencialmente gera tuítes melhores.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129950430","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Gabriel Mello Porcher, G. P. Silva, Daniel Lichtnow
Este trabalho apresenta análises feitas sobre os dados das vendas de uma feira livre utilizando ferramentas de Business Intelligence. As análises foram feitas mediante a elaboração de dashboards e uso de algoritmos de mineração de dados. Os resultados iniciais indicam que é possível estimar a demanda por produtos, algo que pode ser aplicado em outras feiras livres.
{"title":"Análise de Dados de Vendas de Feiras Livres: Um Estudo com a Polifeira da UFSM","authors":"Gabriel Mello Porcher, G. P. Silva, Daniel Lichtnow","doi":"10.5753/erbd.2021.17247","DOIUrl":"https://doi.org/10.5753/erbd.2021.17247","url":null,"abstract":"Este trabalho apresenta análises feitas sobre os dados das vendas de uma feira livre utilizando ferramentas de Business Intelligence. As análises foram feitas mediante a elaboração de dashboards e uso de algoritmos de mineração de dados. Os resultados iniciais indicam que é possível estimar a demanda por produtos, algo que pode ser aplicado em outras feiras livres.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"42 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133249677","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Pedro Costa, J. R. Lima, Ronaldo A. Marques, D. Trindade, K. Komati
O objetivo principal do estudo foi analisar os perfis de usuários, se são ou não bots, na disseminação de uma determinada hashtag na rede social Twitter. Este trabalho apresenta o estudo de caso de duas hashtags que foram compartilhadas: uma que possui indícios de serem disseminadas por bots, e a outra não, sendo utilizada com o objetivo de comparação. Foi possível avaliar que a hashtag com indícios de ter sido impulsionada por robôs ainda apresenta perfis de usuários bots, mesmo meses depois da mesma ter sido uma trend.
{"title":"Estudos de caso de análise de perfis de usuários agrupados por hashtags no Twitter","authors":"Pedro Costa, J. R. Lima, Ronaldo A. Marques, D. Trindade, K. Komati","doi":"10.5753/erbd.2021.17250","DOIUrl":"https://doi.org/10.5753/erbd.2021.17250","url":null,"abstract":"O objetivo principal do estudo foi analisar os perfis de usuários, se são ou não bots, na disseminação de uma determinada hashtag na rede social Twitter. Este trabalho apresenta o estudo de caso de duas hashtags que foram compartilhadas: uma que possui indícios de serem disseminadas por bots, e a outra não, sendo utilizada com o objetivo de comparação. Foi possível avaliar que a hashtag com indícios de ter sido impulsionada por robôs ainda apresenta perfis de usuários bots, mesmo meses depois da mesma ter sido uma trend.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"15 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123871398","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
F. M. Palermo, Samuel R. Cassanego, S. L. S. Mergen
O Jogo da vida (Game of life) é um conhecido programa que usa autômatos celulares para simular a evolução de seres biológicos. Este artigo apresenta a transcrição do código estrutural deste programa para um código orientado a objetos. O objetivo da transcrição é permitir que novos comportamentos sejam adicionados de maneira simples, sem que código pre-existente precise ser modificado. Os testes demonstram que a transcrição foi bem sucedida, e abre caminho para que novos comportamentos sejam testados.
{"title":"Uso de Orientação a Objetos para a Modelagem do Autômato Celular Jogo da Vida","authors":"F. M. Palermo, Samuel R. Cassanego, S. L. S. Mergen","doi":"10.5753/erbd.2021.17253","DOIUrl":"https://doi.org/10.5753/erbd.2021.17253","url":null,"abstract":"O Jogo da vida (Game of life) é um conhecido programa que usa autômatos celulares para simular a evolução de seres biológicos. Este artigo apresenta a transcrição do código estrutural deste programa para um código orientado a objetos. O objetivo da transcrição é permitir que novos comportamentos sejam adicionados de maneira simples, sem que código pre-existente precise ser modificado. Os testes demonstram que a transcrição foi bem sucedida, e abre caminho para que novos comportamentos sejam testados.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"104 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127142499","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Outlying Aspect Mining (OAM) is a new way of handling outliers that, instead of focusing solely on the detection, also provides an explanation. This is done by presenting a subspace of attributes that had the most abnormal behavior. Acknowledging this group of attributes is important but only listing them is not sufficient for a human specialist to comprehend the situation and take the necessary actions. A higher-level, visual approach can improve the process, providing better cognitive clues to experts. Here we describe a Visual Analytics platform developed to present data and OAM outputs in a human-friendly interface. A novelty available on this platform is a parallel coordinates plot that also display temporal multidimensional data. Such representation overcome human visual system limitations and helps in the outlier investigation. To explore the applicability of the developed tool, a locomotive operation user case is employed with focus on fault analysis in an OAM point of view.
{"title":"Visual Analytics e Outlying Aspect Mining: contextualização de anomalias considerando questões temporais e multidimensionais","authors":"Felipe Marx Benghi","doi":"10.5753/erbd.2021.17235","DOIUrl":"https://doi.org/10.5753/erbd.2021.17235","url":null,"abstract":"Outlying Aspect Mining (OAM) is a new way of handling outliers that, instead of focusing solely on the detection, also provides an explanation. This is done by presenting a subspace of attributes that had the most abnormal behavior. Acknowledging this group of attributes is important but only listing them is not sufficient for a human specialist to comprehend the situation and take the necessary actions. A higher-level, visual approach can improve the process, providing better cognitive clues to experts. Here we describe a Visual Analytics platform developed to present data and OAM outputs in a human-friendly interface. A novelty available on this platform is a parallel coordinates plot that also display temporal multidimensional data. Such representation overcome human visual system limitations and helps in the outlier investigation. To explore the applicability of the developed tool, a locomotive operation user case is employed with focus on fault analysis in an OAM point of view.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"11 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"130245155","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
E. S. B. Júnior, Wilian Cavassin, Nádia P. Kozievitch, M. B. Gutierrez
A busca de dados de Pessoa Jurídica é um processo relevante para diversas entidades, seja para consultar uma fonte confiável de dados sobre potenciais parceiros de negócios, para estudos relacionados a desenvolvimento urbano ou para simplesmente coletar informações sobre determinada empresa. Neste contexto, este artigo apresenta uma ferramenta para busca de informações de empresas curitibanas que disponibilize outras formas de consulta além do CNPJ, baseada em Sistemas de Informação Geográfica (SIG) e cidades inteligentes. A ferramenta utiliza dados abertos e aplica algoritmos de comparação textual para aumentar a abrangência dos resultados da busca.
{"title":"Buskaki Empresas - Ferramenta para busca de dados abertos de empresas curitibanas","authors":"E. S. B. Júnior, Wilian Cavassin, Nádia P. Kozievitch, M. B. Gutierrez","doi":"10.5753/erbd.2021.17233","DOIUrl":"https://doi.org/10.5753/erbd.2021.17233","url":null,"abstract":"A busca de dados de Pessoa Jurídica é um processo relevante para diversas entidades, seja para consultar uma fonte confiável de dados sobre potenciais parceiros de negócios, para estudos relacionados a desenvolvimento urbano ou para simplesmente coletar informações sobre determinada empresa. Neste contexto, este artigo apresenta uma ferramenta para busca de informações de empresas curitibanas que disponibilize outras formas de consulta além do CNPJ, baseada em Sistemas de Informação Geográfica (SIG) e cidades inteligentes. A ferramenta utiliza dados abertos e aplica algoritmos de comparação textual para aumentar a abrangência dos resultados da busca.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"38 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"123952495","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Mariana M. Garcez Duarte, M. V. Pontarolo, Rebeca Schroeder Freitas, Carmem S. Hara
Dados coletados a partir de eventos no trânsito, como engarrafamentos e acidentes, são importantes para o planejamento da mobilidade em cidades. O desafio é transformar este conjunto de dados em conhecimento sobre mobilidade. Em razão da velocidade com que os dados são reportados, o armazenamento de eventos é geralmente feito como registros individuais. Embora este modelo de armazenamento garanta um baixo custo de inserção em uma base de dados, ele produz baixo desempenho em consultas que necessitam recuperar eventos que satisfaçam filtros espaço-temporais. Para tratar deste problema, este artigo propõe um método para o armazenamento e indexação de dados de eventos de trânsito baseado em uma tesselação da área de interesse. íE apresentado um estudo de caso que demostra sua aplicação sobre dados coletados no aplicativo Waze.
{"title":"Agrupamento de Eventos de Trânsito baseado em Tesselação","authors":"Mariana M. Garcez Duarte, M. V. Pontarolo, Rebeca Schroeder Freitas, Carmem S. Hara","doi":"10.5753/erbd.2021.17242","DOIUrl":"https://doi.org/10.5753/erbd.2021.17242","url":null,"abstract":"Dados coletados a partir de eventos no trânsito, como engarrafamentos e acidentes, são importantes para o planejamento da mobilidade em cidades. O desafio é transformar este conjunto de dados em conhecimento sobre mobilidade. Em razão da velocidade com que os dados são reportados, o armazenamento de eventos é geralmente feito como registros individuais. Embora este modelo de armazenamento garanta um baixo custo de inserção em uma base de dados, ele produz baixo desempenho em consultas que necessitam recuperar eventos que satisfaçam filtros espaço-temporais. Para tratar deste problema, este artigo propõe um método para o armazenamento e indexação de dados de eventos de trânsito baseado em uma tesselação da área de interesse. íE apresentado um estudo de caso que demostra sua aplicação sobre dados coletados no aplicativo Waze.","PeriodicalId":293556,"journal":{"name":"Anais da XVI Escola Regional de Banco de Dados (ERBD 2021)","volume":"52 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-09-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126456005","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}