Antônio José A. Neto, J. M. Dos Santos, José A. C. Neto, E. D. Moreno
{"title":"集群大数据工具Raspberry Pi e Apache Hadoop - Uma准修订<e:1> o Sistemática da literature","authors":"Antônio José A. Neto, J. M. Dos Santos, José A. C. Neto, E. D. Moreno","doi":"10.5753/sbesc_estendido.2022.228147","DOIUrl":null,"url":null,"abstract":"Este trabalho tem como objetivo identificar como estão sendo desenvolvidos os clusters big data de baixo custo, utilizando Raspberry Pi e Apache Hadoop, e como os mesmos estão sendo validados e monitorados. Para tal fim, foi elaborada uma Quasi-Revisão Sistemática da Literatura (QRSL), resultando em 9 artigos relevantes aptos a responder 3 questões de pesquisa. A QRSL identificou que os modelos de Raspberry Pis mais utilizados no desenvolvimento dos clusters são a Raspberry Pi 4B e a Raspberry Pi 2B, e que para sua validação os benchmarks Terasort e Wordcount são os mais citados na literatura, seguidos da abordagem original do Map Reduce e o TestDFSIO. As 3 únicas ferramentas encontradas para monitoramento dos recursos do cluster foram a Ganglia, Grafana e a Prometheus.","PeriodicalId":305719,"journal":{"name":"Anais Estendidos do XII Simpósio Brasileiro de Engenharia de Sistemas Computacionais (SBESC Estendido 2022)","volume":"108 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-11-21","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Clusters Big Data utilizando Raspberry Pi e Apache Hadoop - Uma Quasi-Revisão Sistemática da Literatura\",\"authors\":\"Antônio José A. Neto, J. M. Dos Santos, José A. C. Neto, E. D. Moreno\",\"doi\":\"10.5753/sbesc_estendido.2022.228147\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Este trabalho tem como objetivo identificar como estão sendo desenvolvidos os clusters big data de baixo custo, utilizando Raspberry Pi e Apache Hadoop, e como os mesmos estão sendo validados e monitorados. Para tal fim, foi elaborada uma Quasi-Revisão Sistemática da Literatura (QRSL), resultando em 9 artigos relevantes aptos a responder 3 questões de pesquisa. A QRSL identificou que os modelos de Raspberry Pis mais utilizados no desenvolvimento dos clusters são a Raspberry Pi 4B e a Raspberry Pi 2B, e que para sua validação os benchmarks Terasort e Wordcount são os mais citados na literatura, seguidos da abordagem original do Map Reduce e o TestDFSIO. As 3 únicas ferramentas encontradas para monitoramento dos recursos do cluster foram a Ganglia, Grafana e a Prometheus.\",\"PeriodicalId\":305719,\"journal\":{\"name\":\"Anais Estendidos do XII Simpósio Brasileiro de Engenharia de Sistemas Computacionais (SBESC Estendido 2022)\",\"volume\":\"108 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-11-21\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais Estendidos do XII Simpósio Brasileiro de Engenharia de Sistemas Computacionais (SBESC Estendido 2022)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/sbesc_estendido.2022.228147\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais Estendidos do XII Simpósio Brasileiro de Engenharia de Sistemas Computacionais (SBESC Estendido 2022)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/sbesc_estendido.2022.228147","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Clusters Big Data utilizando Raspberry Pi e Apache Hadoop - Uma Quasi-Revisão Sistemática da Literatura
Este trabalho tem como objetivo identificar como estão sendo desenvolvidos os clusters big data de baixo custo, utilizando Raspberry Pi e Apache Hadoop, e como os mesmos estão sendo validados e monitorados. Para tal fim, foi elaborada uma Quasi-Revisão Sistemática da Literatura (QRSL), resultando em 9 artigos relevantes aptos a responder 3 questões de pesquisa. A QRSL identificou que os modelos de Raspberry Pis mais utilizados no desenvolvimento dos clusters são a Raspberry Pi 4B e a Raspberry Pi 2B, e que para sua validação os benchmarks Terasort e Wordcount são os mais citados na literatura, seguidos da abordagem original do Map Reduce e o TestDFSIO. As 3 únicas ferramentas encontradas para monitoramento dos recursos do cluster foram a Ganglia, Grafana e a Prometheus.