首页 > 最新文献

Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)最新文献

英文 中文
Sistema Aldeia: Invocação Remota e Assíncrona de Métodos sobre Infiniband e DECK 村庄系统:在Infiniband和DECK上远程异步调用方法
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19017
R. Righi, P. Navaux, Marcelo Pasin
A linguagem Java é cada vez mais utilizada para a construção de aplicações. O próprio sistema de invocação remota de métodos (RMI) da linguagem Java proporciona a escrita de aplicações distribuídas, permitindo comunicação através de TCP/IP entre computadores. Entretanto, tal protocolo impõem penalidades de software para a obtenção de alto desempenho na comunicação. Além disso, Java RMI realiza a comunicação de maneira síncrona, o que pode também contribuir para o decréscimo da eficiência de aplicações escritas com esse sistema. Visando o uso de Java para a programação de alto desempenho em aglomerados, está em desenvolvimento o sistema Aldeia. Ele possibilita a invocação remota e assíncrona de métodos sobre as interfaces de rede lnfiniband e DECK. Esse artigo descreve a estrutura do sistema Aldeia, as tecnologias e as bibliotecas utilizadas para a sua confecção.
Java语言越来越多地用于构建应用程序。Java语言本身的远程方法调用系统(RMI)提供了分布式应用程序的编写,允许计算机之间通过TCP/IP进行通信。然而,这种协议对软件施加了惩罚,以获得高性能的通信。此外,Java RMI执行同步通信,这也会降低用该系统编写的应用程序的效率。针对在集群中使用Java进行高性能编程,Aldeia系统正在开发中。它允许在infiniband和DECK网络接口上远程和异步调用方法。本文描述了Aldeia系统的结构、技术和用于构建它的图书馆。
{"title":"Sistema Aldeia: Invocação Remota e Assíncrona de Métodos sobre Infiniband e DECK","authors":"R. Righi, P. Navaux, Marcelo Pasin","doi":"10.5753/wscad.2004.19017","DOIUrl":"https://doi.org/10.5753/wscad.2004.19017","url":null,"abstract":"A linguagem Java é cada vez mais utilizada para a construção de aplicações. O próprio sistema de invocação remota de métodos (RMI) da linguagem Java proporciona a escrita de aplicações distribuídas, permitindo comunicação através de TCP/IP entre computadores. Entretanto, tal protocolo impõem penalidades de software para a obtenção de alto desempenho na comunicação. Além disso, Java RMI realiza a comunicação de maneira síncrona, o que pode também contribuir para o decréscimo da eficiência de aplicações escritas com esse sistema. Visando o uso de Java para a programação de alto desempenho em aglomerados, está em desenvolvimento o sistema Aldeia. Ele possibilita a invocação remota e assíncrona de métodos sobre as interfaces de rede lnfiniband e DECK. Esse artigo descreve a estrutura do sistema Aldeia, as tecnologias e as bibliotecas utilizadas para a sua confecção.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"7 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115004964","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Uma Arquitetura XML para Computação Colaborativa P2P P2P协作计算的XML架构
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19013
F. Pereira, F. Lourenço, E. A. Schmitz, F. M. França
Este artigo introduz a leC (Infraestrutura Colaborativa): uma arquitetura para computação colaborativa peer-to-peer - P2P - implementada sobre XML, que é de fácil implantação por usuários não-especialistas e de simples utilização por desenvolvedores de aplicações para ambientes colaborativos. O uso de um mecanismo simples de escalonamento distribuído para o balanceamento de carga nos nós computacionais participantes é avaliado em termos da escalabilidade da arquitetura proposta e da qualidade do balanceamento. Tal foi obtido através de simulações usando-se como benchmark um problema do tipo RCPS - Resource Constrained Project Scheduling.
本文介绍了leC(协作基础设施):一种基于XML实现的点对点协作计算体系结构,非专业用户易于部署,协作环境应用程序开发人员也易于使用。根据所提出的体系结构的可伸缩性和平衡的质量,评估了使用一种简单的分布式调度机制来平衡参与计算节点的负载。这是通过使用RCPS -资源约束项目调度作为基准的模拟得到的。
{"title":"Uma Arquitetura XML para Computação Colaborativa P2P","authors":"F. Pereira, F. Lourenço, E. A. Schmitz, F. M. França","doi":"10.5753/wscad.2004.19013","DOIUrl":"https://doi.org/10.5753/wscad.2004.19013","url":null,"abstract":"Este artigo introduz a leC (Infraestrutura Colaborativa): uma arquitetura para computação colaborativa peer-to-peer - P2P - implementada sobre XML, que é de fácil implantação por usuários não-especialistas e de simples utilização por desenvolvedores de aplicações para ambientes colaborativos. O uso de um mecanismo simples de escalonamento distribuído para o balanceamento de carga nos nós computacionais participantes é avaliado em termos da escalabilidade da arquitetura proposta e da qualidade do balanceamento. Tal foi obtido através de simulações usando-se como benchmark um problema do tipo RCPS - Resource Constrained Project Scheduling.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"13 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"116803955","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Integração de Ganglia, libRastro e Pajé para o Monitoramento de Aplicações Paralelas 集成Ganglia, libRastro和paje用于并行应用程序监控
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.18998
M. Neves, Tiago Scheid, L. M. Schnorr, A. Charão
Este artigo trata do uso integrado de diferentes ferramentas de monitoramento a fim de aprimorar a capacidade de análise das execuções de aplicações paralelas. Em particular, descreve-se o processo de integração dos dados coletados por Ganglia, que é uma ferramenta para monitoramento de clusters, aos rastros de execução gerados por libRastro, que é uma biblioteca para instrumentação de aplicações paralelas. A visualização dos dados integrados é feita com a ferramenta Pajé. Através de alguns exemplos de visualizações integradas, demonstra-se que as informações sobre o estado do cluster complementam os rastros de execução da aplicação, permitindo inclusive detectar eventuais problemas na execução da aplicação.
本文讨论了不同监控工具的集成使用,以提高并行应用程序执行的分析能力。特别地,我们描述了由Ganglia(一个集群监控工具)收集的数据与libRastro(一个并行应用程序的仪器库)生成的运行跟踪的集成过程。集成数据的可视化是通过paje工具完成的。通过一些集成视图的示例,我们展示了关于集群状态的信息补充了应用程序执行跟踪,甚至允许检测应用程序执行中的任何问题。
{"title":"Integração de Ganglia, libRastro e Pajé para o Monitoramento de Aplicações Paralelas","authors":"M. Neves, Tiago Scheid, L. M. Schnorr, A. Charão","doi":"10.5753/wscad.2004.18998","DOIUrl":"https://doi.org/10.5753/wscad.2004.18998","url":null,"abstract":"Este artigo trata do uso integrado de diferentes ferramentas de monitoramento a fim de aprimorar a capacidade de análise das execuções de aplicações paralelas. Em particular, descreve-se o processo de integração dos dados coletados por Ganglia, que é uma ferramenta para monitoramento de clusters, aos rastros de execução gerados por libRastro, que é uma biblioteca para instrumentação de aplicações paralelas. A visualização dos dados integrados é feita com a ferramenta Pajé. Através de alguns exemplos de visualizações integradas, demonstra-se que as informações sobre o estado do cluster complementam os rastros de execução da aplicação, permitindo inclusive detectar eventuais problemas na execução da aplicação.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"3 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"115298464","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Checkpointing Quase-Síncrono no LAM/MPI LAM/MPI中的准同步检查点
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19014
U. Silva, Islene C. Garcia
Atualmente, na área de computação de alto desempenho, um número crescente de aplicações distribuídas utiliza alguma biblioteca MPI (Message Passing Interface) para a troca de mensagens. Desse modo, há uma crescente demanda por mecanismos de tolerância a falhas para aplicações que utilizem esse sistema de comunicação. Nesse artigo, é discutida uma infra-estrutura para checkpointing quase-síncrono feita numa implementação livre do padrão MPI como base para a construção de um sistema tolerante a falhas que utilize recuperação por retrocesso de estado.
目前,在高性能计算领域,越来越多的分布式应用程序使用一些MPI库(消息传递接口)来交换消息。因此,对使用该通信系统的应用程序的容错机制的需求越来越大。在本文中,我们讨论了在MPI标准的自由实现中实现的准同步检查指针基础设施,作为构建使用状态回退恢复的容错系统的基础。
{"title":"Checkpointing Quase-Síncrono no LAM/MPI","authors":"U. Silva, Islene C. Garcia","doi":"10.5753/wscad.2004.19014","DOIUrl":"https://doi.org/10.5753/wscad.2004.19014","url":null,"abstract":"Atualmente, na área de computação de alto desempenho, um número crescente de aplicações distribuídas utiliza alguma biblioteca MPI (Message Passing Interface) para a troca de mensagens. Desse modo, há uma crescente demanda por mecanismos de tolerância a falhas para aplicações que utilizem esse sistema de comunicação. Nesse artigo, é discutida uma infra-estrutura para checkpointing quase-síncrono feita numa implementação livre do padrão MPI como base para a construção de um sistema tolerante a falhas que utilize recuperação por retrocesso de estado.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"19 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"125728957","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Comportamento de Aplicações Paralelas em Aglomerados de Computadores Heterogêneos 异构计算机集群上并行应用程序的行为
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19011
Diego Kreutz, L. M. Schnorr, C. Possani, B. Stein
A computação em aglomerados heterogêneos de computadores está cada vez mais presente na área de computação de alto desempenho. Neste contexto, o objetivo desse trabalho é apresentar e analisar alguns dados de desempenho de aplicações paralelas em aglomerados desse gênero. Além disso, é apresentado um calculador de capacidade de computação para nós de processamento de máquinas virtuais LAM/MPI. Com ele o usuário pode facilmente estabelecer um balanceamento de cargas para a sua aplicação, considerando as principais características da mesma.
异构计算机集群计算越来越多地出现在高性能计算领域。在此背景下,本研究的目的是提出和分析这种集群中并行应用程序的一些性能数据。此外,还提出了一种用于LAM/MPI虚拟机处理节点的计算能力计算器。有了它,用户可以很容易地为他们的应用程序建立负载平衡,考虑到它的主要特性。
{"title":"Comportamento de Aplicações Paralelas em Aglomerados de Computadores Heterogêneos","authors":"Diego Kreutz, L. M. Schnorr, C. Possani, B. Stein","doi":"10.5753/wscad.2004.19011","DOIUrl":"https://doi.org/10.5753/wscad.2004.19011","url":null,"abstract":"A computação em aglomerados heterogêneos de computadores está cada vez mais presente na área de computação de alto desempenho. Neste contexto, o objetivo desse trabalho é apresentar e analisar alguns dados de desempenho de aplicações paralelas em aglomerados desse gênero. Além disso, é apresentado um calculador de capacidade de computação para nós de processamento de máquinas virtuais LAM/MPI. Com ele o usuário pode facilmente estabelecer um balanceamento de cargas para a sua aplicação, considerando as principais características da mesma.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"28 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127424470","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Previsão de Desvios Baseada nos Tipos de Desvios e nas Probabilidades de Transição de Históricos 基于偏差类型和历史过渡概率的偏差预测
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19005
Z. A. D. Silva, M. A. Cavenaghi, J. Martini, R. A. L. Gonçalves
As arquiteturas superescalares possuem a habilidade de explorar o paralelismo em nível de instruções. Para isso, técnicas de previsão de desvios são necessárias para tratar as dependências de controle, agilizando a busca de instruções e aumentando o número de instruções úteis disponíveis para a execução paralela. Atualmente, a maioria dos previsores de desvios usa alguma forma de tabela contendo os históricos dos desvios e os endereços alvos a serem seguidos. Sabe-se que estes históricos geram diferentes padrões que se repetem com probabilidades que dependem do fluxo de execução dos programas. O previsor PPM (Prediction Partial Matching), o qual trabalha sobre as probabilidades dos padrões de desvios, foi analisado e serviu de base para o desenvolvimento de um modelo mais agressivo, denominado PPDT (Previsor com Probabilidade Dependente de Transição). Esse novo modelo foi simulado e avaliado sobre a plataforma SimpleScalar Tool Set. Os resultados obtidos sobre benchmarks do SPEC 2000 alcançaram taxas médias de acerto acima de 95% em muitas situações, atingindo picos de 98% para tamanhos de históricos de 16 bits. O modelo PPDT se mostrou mais eficiente do que o PPM e apropriado para implementação real no futuro breve.
超标量体系结构具有在指令级探索并行性的能力。为此,需要偏差预测技术来处理控制依赖关系,加快指令搜索,并增加可用于并行执行的有用指令的数量。目前,大多数偏差预测器使用某种形式的表,其中包含偏差历史和要跟踪的目标地址。众所周知,这些历史会产生不同的模式,这些模式的概率取决于程序的执行流。对预测器PPM(预测部分匹配)进行了分析,该预测器处理偏差模式的概率,并作为发展一个更积极的模型的基础,称为PPDT(过渡依赖概率预测器)。在单纯标量工具集平台上对该新模型进行了仿真和评价。在许多情况下,SPEC 2000基准测试的结果达到了95%以上的平均命中率,16位历史大小达到了98%的峰值。结果表明,PPDT模型比PPM模型更有效,适合在不久的将来实际实施。
{"title":"Previsão de Desvios Baseada nos Tipos de Desvios e nas Probabilidades de Transição de Históricos","authors":"Z. A. D. Silva, M. A. Cavenaghi, J. Martini, R. A. L. Gonçalves","doi":"10.5753/wscad.2004.19005","DOIUrl":"https://doi.org/10.5753/wscad.2004.19005","url":null,"abstract":"As arquiteturas superescalares possuem a habilidade de explorar o paralelismo em nível de instruções. Para isso, técnicas de previsão de desvios são necessárias para tratar as dependências de controle, agilizando a busca de instruções e aumentando o número de instruções úteis disponíveis para a execução paralela. Atualmente, a maioria dos previsores de desvios usa alguma forma de tabela contendo os históricos dos desvios e os endereços alvos a serem seguidos. Sabe-se que estes históricos geram diferentes padrões que se repetem com probabilidades que dependem do fluxo de execução dos programas. O previsor PPM (Prediction Partial Matching), o qual trabalha sobre as probabilidades dos padrões de desvios, foi analisado e serviu de base para o desenvolvimento de um modelo mais agressivo, denominado PPDT (Previsor com Probabilidade Dependente de Transição). Esse novo modelo foi simulado e avaliado sobre a plataforma SimpleScalar Tool Set. Os resultados obtidos sobre benchmarks do SPEC 2000 alcançaram taxas médias de acerto acima de 95% em muitas situações, atingindo picos de 98% para tamanhos de históricos de 16 bits. O modelo PPDT se mostrou mais eficiente do que o PPM e apropriado para implementação real no futuro breve.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"6 2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"126173938","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Uma Ferramenta Orientada a Objetos para Monitoramento de Cargas em Sistemas Distribuídos 用于分布式系统负载监控的面向对象工具
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.18999
Paulino Villas Boas, G. Travieso
Este artigo apresenta uma ferramenta que realiza uma das tarefas mais importantes no processo de balanceamento dinâmico de cargas em sistemas distribuídos: o monitoramento. Tal ferramenta é constituída de duas partes: uma interface de programação, que permite a fácil inserção de códigos em aplicações paralelas para realizar o monitoramento de cargas e um sistema de monitoramento de cargas em tempo de execução para recolher as informações de carga dos computadores do sistema distribuído. Essas informações podem, então, ser utilizadas nas aplicações paralelas ou em um sistema de balanceamento de cargas através da interface de programação para realizar balanceamento dinâmico de cargas.
本文提出了一种工具,它执行分布式系统动态负载平衡过程中最重要的任务之一:监控。该工具由两部分组成:一个编程接口,允许在并行应用程序中轻松插入代码来执行负载监控;一个运行时负载监控系统,从分布式系统的计算机中收集负载信息。然后,这些信息可以通过编程接口在并行应用程序或负载平衡系统中使用,以实现动态负载平衡。
{"title":"Uma Ferramenta Orientada a Objetos para Monitoramento de Cargas em Sistemas Distribuídos","authors":"Paulino Villas Boas, G. Travieso","doi":"10.5753/wscad.2004.18999","DOIUrl":"https://doi.org/10.5753/wscad.2004.18999","url":null,"abstract":"Este artigo apresenta uma ferramenta que realiza uma das tarefas mais importantes no processo de balanceamento dinâmico de cargas em sistemas distribuídos: o monitoramento. Tal ferramenta é constituída de duas partes: uma interface de programação, que permite a fácil inserção de códigos em aplicações paralelas para realizar o monitoramento de cargas e um sistema de monitoramento de cargas em tempo de execução para recolher as informações de carga dos computadores do sistema distribuído. Essas informações podem, então, ser utilizadas nas aplicações paralelas ou em um sistema de balanceamento de cargas através da interface de programação para realizar balanceamento dinâmico de cargas.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"120 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"128136672","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
Arquitetura de Cache com Associatividade Reconfigurável 具有可重构关联的缓存架构
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19000
M. Carvalho, C. Martins
Neste artigo apresentamos uma arquitetura de cache com associatividade reconfigurável. Nossos objetivos principais são: propor e analisar uma arquitetura de memória cache com associatividade reconfigurável/variável. Apresentamos a taxa de erro da execução de algumas cargas de trabalho reais representadas por traces obtidos do BYU Trace Distribution Center. Analisamos o desempenho da arquitetura proposta através de comparação das taxas de erro obtidas através da simulação da arquitetura e de caches associativas por conjunto. Além disso, analisamos o espaço necessário para armazenar as tags na cache. Nossa principal contribuição é a proposta de uma arquitetura de memória cache com associatividade reconfigurável/variável capaz de se adaptar às diferentes cargas de trabalho.
在本文中,我们提出了一种具有可重构关联的缓存体系结构。我们的主要目标是:提出并分析一种具有可重构/可变关联的缓存架构。我们给出了一些实际工作负载执行的错误率,这些工作负载由BYU跟踪分布中心获得的跟踪表示。通过比较仿真体系结构和关联缓存的错误率,分析了所提出的体系结构的性能。此外,我们分析了在缓存中存储标记所需的空间。我们的主要贡献是提出了一种具有可重构/可变关联的缓存架构,能够适应不同的工作负载。
{"title":"Arquitetura de Cache com Associatividade Reconfigurável","authors":"M. Carvalho, C. Martins","doi":"10.5753/wscad.2004.19000","DOIUrl":"https://doi.org/10.5753/wscad.2004.19000","url":null,"abstract":"Neste artigo apresentamos uma arquitetura de cache com associatividade reconfigurável. Nossos objetivos principais são: propor e analisar uma arquitetura de memória cache com associatividade reconfigurável/variável. Apresentamos a taxa de erro da execução de algumas cargas de trabalho reais representadas por traces obtidos do BYU Trace Distribution Center. Analisamos o desempenho da arquitetura proposta através de comparação das taxas de erro obtidas através da simulação da arquitetura e de caches associativas por conjunto. Além disso, analisamos o espaço necessário para armazenar as tags na cache. Nossa principal contribuição é a proposta de uma arquitetura de memória cache com associatividade reconfigurável/variável capaz de se adaptar às diferentes cargas de trabalho.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"2 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"121783937","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 1
Funções MPI de Comunicação Coletiva Reconfiguráveis 可重构的集体通信MPI功能
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19016
L. Ramos, C. Martins
As funções MPI (Message Passing Interface) de comunicação coletiva (FMCC) são comumente implementadas em bibliotecas que utilizam algoritmos invariáveis. Nem sempre elas apresentam o melhor desempenho em todos os tipos de aplicações e ambientes de execução. Neste artigo, apresentamos, simulamos, modelamos analiticamente, verificamos e analisamos FMCC que apresentam estruturas e comportamentos que podem ser alterados para fornecer configurações, flexibilidade e desempenho otimizados. Nossos principais objetivos são: propor e apresentar um conjunto de FMCC (reconfiguráveis) otimizadas; apresentar, simular, modelar analiticamente, verificar e analisar as funções propostas. Nossas metas são: simular diferentes versões de FMCC, incluindo uma versão reconfigurável, e fornecer uma análise comparativa entre implementações fixas e reconfiguráveis. Os resultados mostram que a reconfiguração no nível de algoritmo realmente produz ganhos de flexibilidade e de desempenho em FMCCs.
集体通信(FMCC)消息传递接口(MPI)函数通常在使用不变算法的库中实现。它们并不总是在所有类型的应用程序和执行环境中表现出最好的性能。在本文中,我们提出、模拟、分析建模、验证和分析FMCC,这些FMCC具有可以改变的结构和行为,以提供优化的配置、灵活性和性能。我们的主要目标是:提出并呈现一套优化的FMCC(可重构);提出,模拟,分析建模,验证和分析所提出的功能。我们的目标是:模拟不同版本的FMCC,包括一个可重构版本,并提供固定和可重构实现之间的比较分析。结果表明,算法级重构确实提高了fmcc的灵活性和性能。
{"title":"Funções MPI de Comunicação Coletiva Reconfiguráveis","authors":"L. Ramos, C. Martins","doi":"10.5753/wscad.2004.19016","DOIUrl":"https://doi.org/10.5753/wscad.2004.19016","url":null,"abstract":"As funções MPI (Message Passing Interface) de comunicação coletiva (FMCC) são comumente implementadas em bibliotecas que utilizam algoritmos invariáveis. Nem sempre elas apresentam o melhor desempenho em todos os tipos de aplicações e ambientes de execução. Neste artigo, apresentamos, simulamos, modelamos analiticamente, verificamos e analisamos FMCC que apresentam estruturas e comportamentos que podem ser alterados para fornecer configurações, flexibilidade e desempenho otimizados. Nossos principais objetivos são: propor e apresentar um conjunto de FMCC (reconfiguráveis) otimizadas; apresentar, simular, modelar analiticamente, verificar e analisar as funções propostas. Nossas metas são: simular diferentes versões de FMCC, incluindo uma versão reconfigurável, e fornecer uma análise comparativa entre implementações fixas e reconfiguráveis. Os resultados mostram que a reconfiguração no nível de algoritmo realmente produz ganhos de flexibilidade e de desempenho em FMCCs.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"25 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"127438637","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
O Consumo de Energia da Arquitetura DTSVLIW DTSVLIW架构的能耗
Pub Date : 2004-10-27 DOI: 10.5753/wscad.2004.19004
F. Pedroni, Fernando Líbio L. Almeida, A. F. D. Souza
Neste trabalho apresentamos um estudo sobre o consumo de energia da arquitetura DTSVLIW. Nós implementamos uma versão do nosso simulador DTSVLIW capaz de medir tanto o consumo de energia dinâmico quanto o estático. Comparamos estes resultados com os de simuladores da arquitetura do processador Alpha 21264, como o Wattch e o Hotleackage. Os experimentos mostraram que a arquitetura DTSVLIW consome consideravelmente menos energia que o processador Alpha 21264.
本文对DTSVLIW架构的能耗进行了研究。我们实现了一个版本的DTSVLIW模拟器,能够测量动态和静态功耗。我们将这些结果与Alpha 21264处理器架构模拟器的结果进行了比较,如Wattch和Hotleackage。实验表明,DTSVLIW架构比Alpha 21264处理器消耗的能量要少得多。
{"title":"O Consumo de Energia da Arquitetura DTSVLIW","authors":"F. Pedroni, Fernando Líbio L. Almeida, A. F. D. Souza","doi":"10.5753/wscad.2004.19004","DOIUrl":"https://doi.org/10.5753/wscad.2004.19004","url":null,"abstract":"Neste trabalho apresentamos um estudo sobre o consumo de energia da arquitetura DTSVLIW. Nós implementamos uma versão do nosso simulador DTSVLIW capaz de medir tanto o consumo de energia dinâmico quanto o estático. Comparamos estes resultados com os de simuladores da arquitetura do processador Alpha 21264, como o Wattch e o Hotleackage. Os experimentos mostraram que a arquitetura DTSVLIW consome consideravelmente menos energia que o processador Alpha 21264.","PeriodicalId":103064,"journal":{"name":"Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)","volume":"17 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2004-10-27","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114973310","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
引用次数: 0
期刊
Anais do V Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2004)
全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1