Being able to detect failures is an important issue in designing fault-tolerant distributed systems. However, the actual behaviour of a system limits the ability to provide such a mechanism. From one extreme of the spectrum, synchronous systems (i.e., with bounded message transmission delay and processing times) allow for the construction of perfect failure detection based simply on local timeouts. At the other extreme, accurate failure detection cannot be developed for asynchronous systems (i.e. systems with no bounds on message transmission delays and processing times), unless some extra properties can be guaranteed, such the ones specified in a seminal article by Chandra and Toueg [1]. The present paper discusses the requirements and describes the implementations of failure detectors for two important fault-tolerant mechanisms meant to asynchronous environments: process group membership and <>S Failure Detector based distributed consensus [1]. These implementations are based on a mechanism called the Time Connectivity Indicator, introduced in this paper.
{"title":"Failure Detection in Asynchronous Distributed Systems","authors":"Raimundo José de Araújo, Macêdo, Campus de Ondina","doi":"10.5753/wtf.2000.23478","DOIUrl":"https://doi.org/10.5753/wtf.2000.23478","url":null,"abstract":"Being able to detect failures is an important issue in designing fault-tolerant distributed systems. However, the actual behaviour of a system limits the ability to provide such a mechanism. From one extreme of the spectrum, synchronous systems (i.e., with bounded message transmission delay and processing times) allow for the construction of perfect failure detection based simply on local timeouts. At the other extreme, accurate failure detection cannot be developed for asynchronous systems (i.e. systems with no bounds on message transmission delays and processing times), unless some extra properties can be guaranteed, such the ones specified in a seminal article by Chandra and Toueg [1]. The present paper discusses the requirements and describes the implementations of failure detectors for two important fault-tolerant mechanisms meant to asynchronous environments: process group membership and <>S Failure Detector based distributed consensus [1]. These implementations are based on a mechanism called the Time Connectivity Indicator, introduced in this paper.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"284 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127556389","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Replicação de objetos é usada para garantir uma maior disponibilidade de recursos em um sistema distribuído. Porém, surgem problemas como o controle da consistência, o número de réplicas necessárias e onde estas réplicas devem estar posicionadas. A consistência é garantida por um protocolo de consistência de réplicas. O problema da determinação do número de réplicas e onde as mesmas devem estar posicionadas é resolvido, atualmente, de forma empírica pelos projetistas ou administradores dos sistemas. Neste artigo são abordados aspectos a serem considerados nas decisões de posicionamento automático de réplicas e é proposto um módulo gerente, o RPM, Replica Placement Manager, o qual determina onde as réplicas devem ser posicionadas, através de informações obtidas pelo monitoramento dinâmico do sistema.
{"title":"RPM: Um Sistema para Posicionar Réplicas","authors":"A. Zampieri, T. Weber, Marcia Pasin","doi":"10.5753/wtf.2000.23470","DOIUrl":"https://doi.org/10.5753/wtf.2000.23470","url":null,"abstract":"Replicação de objetos é usada para garantir uma maior disponibilidade de recursos em um sistema distribuído. Porém, surgem problemas como o controle da consistência, o número de réplicas necessárias e onde estas réplicas devem estar posicionadas. A consistência é garantida por um protocolo de consistência de réplicas. O problema da determinação do número de réplicas e onde as mesmas devem estar posicionadas é resolvido, atualmente, de forma empírica pelos projetistas ou administradores dos sistemas. Neste artigo são abordados aspectos a serem considerados nas decisões de posicionamento automático de réplicas e é proposto um módulo gerente, o RPM, Replica Placement Manager, o qual determina onde as réplicas devem ser posicionadas, através de informações obtidas pelo monitoramento dinâmico do sistema.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"140 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121908640","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Cristina Verçosa Pérez Barrios de Souza, Carlos A. Maziero
Esse artigo objetiva apresentar a possibilidade de inclusão da reflexão computacional na plataforma J2EE, mantendo todas as suas de características de interoperabilidade, portabilidade e consistência de ambiente. Para tanto, pretende-se utilizar a habilidade de composição das aplicações J2EE, em conjunto com suas instruções de implantação (deployment descriptors), de forma a possibilitar a alteração do comportamento de componentes servidores, incluindo assim algum grau de flexibilização de implementação por parte do implantador da aplicação. Uma vez estabelecida uma forma adequada de incluir reflexão na plataforma J2EE, pretende-se validar a proposta com a implementação de mecanismos de replicação em componentes servidores de negócio, visando tolerância a falhas e disponibilidade.
{"title":"Uma Abordagem Reflexiva para Replicação de Componentes Servidores da Plataforma Java para Corporações","authors":"Cristina Verçosa Pérez Barrios de Souza, Carlos A. Maziero","doi":"10.5753/wtf.2000.23483","DOIUrl":"https://doi.org/10.5753/wtf.2000.23483","url":null,"abstract":"Esse artigo objetiva apresentar a possibilidade de inclusão da reflexão computacional na plataforma J2EE, mantendo todas as suas de características de interoperabilidade, portabilidade e consistência de ambiente. Para tanto, pretende-se utilizar a habilidade de composição das aplicações J2EE, em conjunto com suas instruções de implantação (deployment descriptors), de forma a possibilitar a alteração do comportamento de componentes servidores, incluindo assim algum grau de flexibilização de implementação por parte do implantador da aplicação. Uma vez estabelecida uma forma adequada de incluir reflexão na plataforma J2EE, pretende-se validar a proposta com a implementação de mecanismos de replicação em componentes servidores de negócio, visando tolerância a falhas e disponibilidade.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"422 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"132873107","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Existem atualmente diversos tipos de ferramentas para injeção de falhas por software. Muitas delas, no entanto, apresentam um destes problemas: ou causam um overhead muito grande na aplicação alvo ou só conseguem representar um modelo de falhas significativo em um nível muito baixo, muito próximo do hardware mas muito distante da aplicação. Neste artigo, apresenta-se um técnica de implementação de ferramentas de injeção de falhas que procura contrabalançar estes dois fatores.
{"title":"Utilização de Reflexão Computacional em Tempo de Compilação para Implementação de Ferramentas de Injeção de Falhas","authors":"Michael Menna Barreto Leske, Eliane Martins","doi":"10.5753/wtf.2000.23484","DOIUrl":"https://doi.org/10.5753/wtf.2000.23484","url":null,"abstract":"Existem atualmente diversos tipos de ferramentas para injeção de falhas por software. Muitas delas, no entanto, apresentam um destes problemas: ou causam um overhead muito grande na aplicação alvo ou só conseguem representar um modelo de falhas significativo em um nível muito baixo, muito próximo do hardware mas muito distante da aplicação. Neste artigo, apresenta-se um técnica de implementação de ferramentas de injeção de falhas que procura contrabalançar estes dois fatores.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"131400840","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Este artigo trata da validação experimental de mecanismos de Tolerância a Falhas através da Injeção de Falhas, relatando a experiência obtida durante a implementação da ferramenta ComFIRM. É feita uma pequena revisão dos conceitos genéricos de Injeção de Falhas (por simulação, hardware e software) e então são dissecadas as técnicas de implementação de injetores de falhas em software, considerando suas vantagens e desvantagens. É dada especial atenção à Injeção de Falhas no nível do Sistema Operacional.
{"title":"Experiência com a Implementação de um Injetor de Falhas em Linux","authors":"F. Leite, T. Weber","doi":"10.5753/wtf.2000.23481","DOIUrl":"https://doi.org/10.5753/wtf.2000.23481","url":null,"abstract":"Este artigo trata da validação experimental de mecanismos de Tolerância a Falhas através da Injeção de Falhas, relatando a experiência obtida durante a implementação da ferramenta ComFIRM. É feita uma pequena revisão dos conceitos genéricos de Injeção de Falhas (por simulação, hardware e software) e então são dissecadas as técnicas de implementação de injetores de falhas em software, considerando suas vantagens e desvantagens. É dada especial atenção à Injeção de Falhas no nível do Sistema Operacional.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"14 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116080647","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Dependable Multiparty Interacion (DMI) has recently been introduced as a mechanism that provides reliable interaction between participants. Specifically, a DMI is a multiparty interaction mechanism that provides facilities for handling concurrent exceptions and assuring consistency upon leaving the interaction. This paper describes how the DMI mechanism can be added to a programming language.
{"title":"A Language Construct for DMIs","authors":"A. Zorzo","doi":"10.5753/wtf.2000.23485","DOIUrl":"https://doi.org/10.5753/wtf.2000.23485","url":null,"abstract":"Dependable Multiparty Interacion (DMI) has recently been introduced as a mechanism that provides reliable interaction between participants. Specifically, a DMI is a multiparty interaction mechanism that provides facilities for handling concurrent exceptions and assuring consistency upon leaving the interaction. This paper describes how the DMI mechanism can be added to a programming language.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"50 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"129217862","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Considere uma rede de computadores de topologia arbitrária. Um algoritmo de diagnóstico distribuído permite que os nodos sem falha desta rede determinem quais outros nodos da rede são alcançáveis em um determinado momento. Este trabalho apresenta um algoritmo de diagnóstico em redes de topologia arbitrária. Cada nodo da rede testa os seus vizinhos. Quando um nodo detecta a falha de um link este dissemina, em paralelo, para os seus vizinhos, uma pequena mensagem contendo três campos, o identificador dos nodos envolvidos e um contador indicando a falha, avisando-os da falha encontrada. Cada nodo, ao receber a mensagem, atualiza as informações locais de diagnóstico e dissemina a mensagem para seus vizinhos, exceto para aquele do qual a mensagem foi recebida. Quando um nodo ja conhece o evento propagado pela mensagem, esta é simplesmente descartada. Experimentos obtidos através de simulação em redes de diferentes topologias confirmam que a latência do algoritmo é a melhor possível, isto é, proporcional ao diâmetro da rede. Os experimentos mostram que o número prático de mensagens redundantes geradas é, na média, menor que o máximo possivel, isto é, o dobro do número de links.
{"title":"Diagnóstico em Redes de Topologia Arbitrária: Um Algoritmo Baseado em Inundação de Mensagens","authors":"E. P. Duarte Jr., G. Mattos","doi":"10.5753/wtf.2000.23479","DOIUrl":"https://doi.org/10.5753/wtf.2000.23479","url":null,"abstract":"Considere uma rede de computadores de topologia arbitrária. Um algoritmo de diagnóstico distribuído permite que os nodos sem falha desta rede determinem quais outros nodos da rede são alcançáveis em um determinado momento. Este trabalho apresenta um algoritmo de diagnóstico em redes de topologia arbitrária. Cada nodo da rede testa os seus vizinhos. Quando um nodo detecta a falha de um link este dissemina, em paralelo, para os seus vizinhos, uma pequena mensagem contendo três campos, o identificador dos nodos envolvidos e um contador indicando a falha, avisando-os da falha encontrada. Cada nodo, ao receber a mensagem, atualiza as informações locais de diagnóstico e dissemina a mensagem para seus vizinhos, exceto para aquele do qual a mensagem foi recebida. Quando um nodo ja conhece o evento propagado pela mensagem, esta é simplesmente descartada. Experimentos obtidos através de simulação em redes de diferentes topologias confirmam que a latência do algoritmo é a melhor possível, isto é, proporcional ao diâmetro da rede. Os experimentos mostram que o número prático de mensagens redundantes geradas é, na média, menor que o máximo possivel, isto é, o dobro do número de links.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"35 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114979514","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Luiz Angelo Barchet Estefanel, Ingrid Jansch-Pôrto
A transposição de um modelo teórico para uma implementação costuma apresentar diversos problemas inesperados. No caso dos detectores de defeitos, a carência de publicações que demonstrem tais experiências muitas vezes leva a esforços duplicados e atrasos na solução dos problemas. Este artigo apresenta a experiência e as observações realizadas durante o desenvolvimento de um detector de defeitos Heartbeat, ilustrando bem os problemas desta transposição e quais soluções práticas foram tomadas neste experimento.
{"title":"Avaliação Prática de um Detector de Defeitos: teoria versus implementação","authors":"Luiz Angelo Barchet Estefanel, Ingrid Jansch-Pôrto","doi":"10.5753/wtf.2000.23477","DOIUrl":"https://doi.org/10.5753/wtf.2000.23477","url":null,"abstract":"A transposição de um modelo teórico para uma implementação costuma apresentar diversos problemas inesperados. No caso dos detectores de defeitos, a carência de publicações que demonstrem tais experiências muitas vezes leva a esforços duplicados e atrasos na solução dos problemas. Este artigo apresenta a experiência e as observações realizadas durante o desenvolvimento de um detector de defeitos Heartbeat, ilustrando bem os problemas desta transposição e quais soluções práticas foram tomadas neste experimento.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"138 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127530396","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Critérios de teste de software visam conduzir e avaliar a qualidade da atividade de teste. Entre os vários critérios propostos, destacam-se os critérios estruturais, baseados em fluxo de controle e baseados em fluxo de dados, e o critério Análise de Mutantes, baseado em erros. O critério Análise de Mutantes é um critério bastante atrativo, porém possui um alto custo computacional. Os “Critérios Restritos” foram propostos para aumentar a eficácia dos critérios estruturais, pois possuem uma grande habilidade para detectar erros. Este trabalho apresenta resultados de uma comparação entre os Critérios Restritos e o critério Análise de Mutantes, considerando os fatores eficácia em termos de número de erros revelados e, custo, em termos do número de casos de testes necessários.
{"title":"Resultados de uma Aplicação do Critério Análise de Mutantes e do Critério Todos-Potenciais-Usos Restritos","authors":"Inali Wisniewiski Soares, S. Vergilio","doi":"10.5753/wtf.2000.23474","DOIUrl":"https://doi.org/10.5753/wtf.2000.23474","url":null,"abstract":"Critérios de teste de software visam conduzir e avaliar a qualidade da atividade de teste. Entre os vários critérios propostos, destacam-se os critérios estruturais, baseados em fluxo de controle e baseados em fluxo de dados, e o critério Análise de Mutantes, baseado em erros. O critério Análise de Mutantes é um critério bastante atrativo, porém possui um alto custo computacional. Os “Critérios Restritos” foram propostos para aumentar a eficácia dos critérios estruturais, pois possuem uma grande habilidade para detectar erros. Este trabalho apresenta resultados de uma comparação entre os Critérios Restritos e o critério Análise de Mutantes, considerando os fatores eficácia em termos de número de erros revelados e, custo, em termos do número de casos de testes necessários.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"24 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121099412","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Este trabalho apresenta uma proposta de extensão da especificação do serviço de detecção de falha do padrão FF CORBA [OMG99]. A motivação disso, é que muitos dos requisitos de tolerância falha para sistemas de larga-escala, tal como a internet, ainda não foram discutidos, de forma precisa, nessa especificação. A solução proposta visa atender aos requisitos de sistemas de larga escala (inerentemente assíncronos). Um protocolo de acordo baseado em voto majoritário é adaptado de forma a melhor se adequar à especificação FT CORBA.
{"title":"Detecção de Falha para Redes de Larga Escala no Fault-Tolerant CORBA","authors":"L. C. Lung, J. Fraga","doi":"10.5753/wtf.2000.23467","DOIUrl":"https://doi.org/10.5753/wtf.2000.23467","url":null,"abstract":"Este trabalho apresenta uma proposta de extensão da especificação do serviço de detecção de falha do padrão FF CORBA [OMG99]. A motivação disso, é que muitos dos requisitos de tolerância falha para sistemas de larga-escala, tal como a internet, ainda não foram discutidos, de forma precisa, nessa especificação. A solução proposta visa atender aos requisitos de sistemas de larga escala (inerentemente assíncronos). Um protocolo de acordo baseado em voto majoritário é adaptado de forma a melhor se adequar à especificação FT CORBA.","PeriodicalId":356716,"journal":{"name":"Anais do II Workshop de Testes e Tolerância a Falhas (WTF 2000)","volume":"40 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2000-07-15","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124508260","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}