{"title":"Uso de Dados Provenientes de Rede Social e Técnica de Mineração de Dados\npara Classificar Crimes em Belém-PA","authors":"Lucas Furtado, A. Souza","doi":"10.32640/TASJ.2019.2.121","DOIUrl":null,"url":null,"abstract":"A Grande Belém enfrenta o desafio de reduzir a taxa de criminalidade na capital e nos\nmunicípios. O ano de 2017 foi o mais violento da história: a recordista marca de 4.416 mortes violentas foi registrada no referido estado, com a média diária de 12 mortes. Inserido neste contexto, este trabalho tem como objetivo identificar e classificar crimes realizados em determinados bairros de Belém utilizando a técnica de mineração de dados. Na primeira etapa foi realizada a extração e seleção dos dados usando a ferramenta computacional python e armazenando-os em uma planilha eletrônica (Excel). Na segunda etapa, aconteceu o préprocessamento, a organização dos dados, ou seja, realizamos a limpeza, integração, transformação e redução do conjunto de dados. No penúltimo momento, foi utilizado o algoritmo chamado Árvore de Classificação e Regressão nos dados coletados utilizando a biblioteca SciKit-Learning. A última etapa do processo foi a avaliação dos dados das quatro métricas de desempenho estabelecidas: acurácia, taxa de erro, sensibilidade e especificidade. Através da Utilização da seleção dos dados foi possível sumarizá-los, assim como, dos testes e experimentos realizados com a técnica de mineração de dados, foi possível identificar padrões escondidos nas postagens em redes sociais, facilitando a identificação das ocorrências criminosas em Belém-PA. Dessa forma, a sociedade tomará conhecimento da situação que se encontra os crimes na cidade nos seus respectivos meses, dias da semana, períodos do dia e bairros no intuito de se proteger ou ficar em alerta ao andar por determinados locais onde a incidência de crimes é grande.","PeriodicalId":227717,"journal":{"name":"The Academic Society Journal","volume":"4 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2019-06-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"The Academic Society Journal","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.32640/TASJ.2019.2.121","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
A Grande Belém enfrenta o desafio de reduzir a taxa de criminalidade na capital e nos
municípios. O ano de 2017 foi o mais violento da história: a recordista marca de 4.416 mortes violentas foi registrada no referido estado, com a média diária de 12 mortes. Inserido neste contexto, este trabalho tem como objetivo identificar e classificar crimes realizados em determinados bairros de Belém utilizando a técnica de mineração de dados. Na primeira etapa foi realizada a extração e seleção dos dados usando a ferramenta computacional python e armazenando-os em uma planilha eletrônica (Excel). Na segunda etapa, aconteceu o préprocessamento, a organização dos dados, ou seja, realizamos a limpeza, integração, transformação e redução do conjunto de dados. No penúltimo momento, foi utilizado o algoritmo chamado Árvore de Classificação e Regressão nos dados coletados utilizando a biblioteca SciKit-Learning. A última etapa do processo foi a avaliação dos dados das quatro métricas de desempenho estabelecidas: acurácia, taxa de erro, sensibilidade e especificidade. Através da Utilização da seleção dos dados foi possível sumarizá-los, assim como, dos testes e experimentos realizados com a técnica de mineração de dados, foi possível identificar padrões escondidos nas postagens em redes sociais, facilitando a identificação das ocorrências criminosas em Belém-PA. Dessa forma, a sociedade tomará conhecimento da situação que se encontra os crimes na cidade nos seus respectivos meses, dias da semana, períodos do dia e bairros no intuito de se proteger ou ficar em alerta ao andar por determinados locais onde a incidência de crimes é grande.
Grande belem面临着降低首都和市政当局犯罪率的挑战。2017年是历史上最暴力的一年:该州记录了创纪录的4416人暴力死亡,平均每天有12人死亡。在此背景下,本研究旨在利用数据挖掘技术识别和分类在belem某些社区发生的犯罪。在第一步中,使用python计算工具提取和选择数据,并将其存储在电子表格(Excel)中。第二步是预处理、数据组织,即对数据集进行清理、集成、转换和减少。在倒数第二时刻,我们使用了一种叫做分类树的算法,并对使用SciKit-Learning库收集的数据进行回归。该过程的最后一步是评估四个已建立的性能指标的数据:准确性、错误率、敏感性和特异性。通过数据选择的使用,可以对它们进行总结,以及使用数据挖掘技术进行的测试和实验,可以识别社交网络帖子中隐藏的模式,便于识别belem -PA中的犯罪事件。通过这种方式,社会将了解城市在各自的月份、一周、一天的时间段和社区的犯罪情况,以保护自己或在犯罪发生率高的某些地方行走时保持警惕。