Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)最新文献

英文中文

AdXen: Uma Ferramenta para Administração de Arquiteturas Virtualizadas Distribuídas Baseadas em Xen AdXen:基于Xen的分布式虚拟化体系结构管理工具

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18752

G. Koslovski, Márcio Parise Boufleur, A. Charão

O monitor de máquinas virtuais Xen permite a execução simultânea de diversos sistemas operacionais sobre uma arquitetura real, compartilhando os recursos de hardware existentes. Esta tecnologia vem se popularizando como uma solução para consolidação de servidores e gerenciamento de clusters e redes de computadores. Em ambientes virtualizados, há diversas tarefas administrativas para manipulação e gerenciamento dos sistemas operacionais hospedados. Originalmente, Xen não oferece uma interface para gerenciamento de ambientes virtualizados distribuídos, tornando esta tarefa complexa para administradores. Este artigo apresenta o desenvolvimento de uma ferramenta denominada AdXen, para administração de arquiteturas virtualizadas baseadas em Xen. O projeto dessa ferramenta teve como foco os ambientes virtualizados distribuídos, formados por vários computadores interligados executando múltiplas máquinas virtuais. Ao longo do artigo, discute-se as principais questões de projeto e implementação de AdXen e avalia-se as vantagens desta ferramenta frente a outras soluções para administração de arquiteturas virtualizadas.

Xen虚拟机监视器允许在一个真实的架构上同时运行多个操作系统，共享现有的硬件资源。该技术作为服务器整合、集群管理和计算机网络的解决方案越来越受欢迎。在虚拟化环境中，有几个管理任务来操作和管理托管的操作系统。最初，Xen没有提供管理分布式虚拟化环境的接口，这使得管理员的任务变得复杂。本文介绍了一种名为AdXen的工具的开发，用于管理基于Xen的虚拟化体系结构。该工具的设计重点是分布式虚拟化环境，由运行多个虚拟机的多台联网计算机组成。在本文中，我们讨论了AdXen的主要设计和实现问题，并评估了该工具相对于虚拟化体系结构管理的其他解决方案的优势。

{"title":"AdXen: Uma Ferramenta para Administração de Arquiteturas Virtualizadas Distribuídas Baseadas em Xen","authors":"G. Koslovski, Márcio Parise Boufleur, A. Charão","doi":"10.5753/wscad.2007.18752","DOIUrl":"https://doi.org/10.5753/wscad.2007.18752","url":null,"abstract":"O monitor de máquinas virtuais Xen permite a execução simultânea de diversos sistemas operacionais sobre uma arquitetura real, compartilhando os recursos de hardware existentes. Esta tecnologia vem se popularizando como uma solução para consolidação de servidores e gerenciamento de clusters e redes de computadores. Em ambientes virtualizados, há diversas tarefas administrativas para manipulação e gerenciamento dos sistemas operacionais hospedados. Originalmente, Xen não oferece uma interface para gerenciamento de ambientes virtualizados distribuídos, tornando esta tarefa complexa para administradores. Este artigo apresenta o desenvolvimento de uma ferramenta denominada AdXen, para administração de arquiteturas virtualizadas baseadas em Xen. O projeto dessa ferramenta teve como foco os ambientes virtualizados distribuídos, formados por vários computadores interligados executando múltiplas máquinas virtuais. Ao longo do artigo, discute-se as principais questões de projeto e implementação de AdXen e avalia-se as vantagens desta ferramenta frente a outras soluções para administração de arquiteturas virtualizadas.","PeriodicalId":244503,"journal":{"name":"Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)","volume":"59 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2007-10-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122173979","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Implementações de Algoritmos Paralelos FPT para o Problema da k-Cobertura por Vértices utilizando Clusters e Grades Computacionais 利用集群和计算网格实现顶点k覆盖问题的并行FPT算法

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18764

Henrique Mongelli, Rodrigo Cesar Sakamoto

Em muitas aplicações problemas NP-completos precisam ser solucionados de forma exata. Um método promissor para tratar com alguns problemas intratáveis é através da Complexidade Parametrizada que divide a entrada do problema em uma parte principal e um parâmetro. A parte principal contribui polinomialmente com a complexidade total do problema, enquanto que o parâmetro é responsável pela explosão combinatorial. Consideramos o algoritmo paralelo FPT de Cheetham para solucionar o problema da k-Cobertura por Vértices e a implementação refinada e melhorada de Hanashiro. Como este é um problema em que grande parte do tempo de execução é feita de forma independente, sem a necessidade de comunicação entre os processadores, a utilização de grades computacionais torna-se bastante aplicável, com a possibilidade do emprego de um número grande de processadores. Este trabalho envolve a implementação no Integrade de algoritmos FPT paralelos para o problema da k-Cobertura por vértices. A grade computacional dos testes utiliza o middleware desenvolvido no Projeto Integrade. Estes algoritmos foram implementados usando a biblioteca BSPLib do Integrade e mostraram um desempenho muito bom e que pode ser melhorado com a adição de novos processadores. Em nossos experimentos no Integrade, em comparação a implementação em cluster, obtivemos tempos paralelos melhores do que os relatados por Hanashiro.

在许多应用中，NP完全问题需要精确地解决。处理一些棘手问题的一种很有前途的方法是通过参数化复杂性，将问题的输入划分为一个主要部分和一个参数。主要部分对问题的整体复杂性有多项式贡献，而参数是组合爆炸的原因。我们考虑了Cheetham的并行FPT算法来解决顶点k覆盖问题，并对Hanashiro的实现进行了改进。由于这是一个大部分执行时间都是独立完成的问题，不需要处理器之间的通信，计算网格的使用变得非常适用，有可能使用大量的处理器。这项工作涉及到顶点k覆盖问题的并行FPT算法的集成实现。测试的计算网格使用Integrade项目中开发的中间件。这些算法使用Integrade的BSPLib库实现，并显示出非常好的性能，可以通过添加新的处理器来改进。在我们的Integrade实验中，与集群实现相比，我们得到了比Hanashiro报告的更好的并行时间。

{"title":"Implementações de Algoritmos Paralelos FPT para o Problema da k-Cobertura por Vértices utilizando Clusters e Grades Computacionais","authors":"Henrique Mongelli, Rodrigo Cesar Sakamoto","doi":"10.5753/wscad.2007.18764","DOIUrl":"https://doi.org/10.5753/wscad.2007.18764","url":null,"abstract":"Em muitas aplicações problemas NP-completos precisam ser solucionados de forma exata. Um método promissor para tratar com alguns problemas intratáveis é através da Complexidade Parametrizada que divide a entrada do problema em uma parte principal e um parâmetro. A parte principal contribui polinomialmente com a complexidade total do problema, enquanto que o parâmetro é responsável pela explosão combinatorial. Consideramos o algoritmo paralelo FPT de Cheetham para solucionar o problema da k-Cobertura por Vértices e a implementação refinada e melhorada de Hanashiro. Como este é um problema em que grande parte do tempo de execução é feita de forma independente, sem a necessidade de comunicação entre os processadores, a utilização de grades computacionais torna-se bastante aplicável, com a possibilidade do emprego de um número grande de processadores. Este trabalho envolve a implementação no Integrade de algoritmos FPT paralelos para o problema da k-Cobertura por vértices. A grade computacional dos testes utiliza o middleware desenvolvido no Projeto Integrade. Estes algoritmos foram implementados usando a biblioteca BSPLib do Integrade e mostraram um desempenho muito bom e que pode ser melhorado com a adição de novos processadores. Em nossos experimentos no Integrade, em comparação a implementação em cluster, obtivemos tempos paralelos melhores do que os relatados por Hanashiro.","PeriodicalId":244503,"journal":{"name":"Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)","volume":"37 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2007-10-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"133502334","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Um Algoritmo de Reconfiguração da Associatividade em Memórias Cache 一种缓存内存关联重构算法

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18761

Roberto B. Kerr Jr., Edson T. Midorikawa

A aplicação de dispositivos reconfiguráveis em sistemas de computação de alto desempenho tem se difundido recentemente. Dentre as áreas de pesquisa com maior possibilidade de ganho de desempenho se destacam os projetos com caches reconfiguráveis. Trabalhos anteriores já mostraram a possibilidade de implementar reconfiguração em diversos campos da memória cache, como por exemplo, o tamanho da linha, a associatividade ou o algoritmo de substituição. Neste artigo analisamos uma proposta de um algoritmo de reconfiguração da associatividade. A análise foi conduzida com a utilização de traces do Spec2000 obtidos do BYU Trace Distribution Center. Resultados experimentais mostraram ganhos de desempenho em relação aos caches tradicionais e em relação a um algoritmo reconfigurável proposto na literatura.

可重构设备在高性能计算系统中的应用近年来得到了广泛的应用。在具有更高性能增益可能性的研究领域中，具有可重构缓存的项目脱颖而出。以前的工作已经证明了在缓存内存的几个领域实现重构的可能性，如行大小、关联或替换算法。本文分析了一种结合重构算法的建议。使用BYU轨迹分布中心获得的Spec2000轨迹进行分析。实验结果表明，与传统缓存和文献中提出的可重构算法相比，性能有所提高。

引用次数: 1

Sistema Selecionador de Recursos Computacionais de Grade baseado na Interoperabilidade de Múltiplas Ontologias 基于多本体互操作性的网格计算资源选择器系统

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18753

A. P. Silva, M. R. Dantas

O paradigma de grade computacional tem como uma das suas principais características o compartilhamento de recursos heterogêneos espalhados geograficamente por diversas organizações virtuais. No entanto, o processo de seleção destes recursos toma-se na prática difícil, pois as organizações apresentam visões distintas quanto à forma de descrever seus recursos. Desta forma, em um sistema de seleção de recursos em grades é desejável realizar comparações semânticas. Neste artigo, propomos um sistema selecionador de recursos que considera diferentes visões que as organizações podem apresentar. Este sistema apoia-se na abordagem de integração híbrida sobre regras semânticas para alcançar a interoperabilidade entre as diversas ontologias. Resultados experimentais práticos indicam que o sistema alcançou com sucesso o objetivo.

计算网格范式的主要特征之一是在地理上分散在几个虚拟组织中的异构资源的共享。然而，选择这些资源的过程在实践中是困难的，因为组织对如何描述其资源有不同的观点。因此，在网格资源选择系统中进行语义比较是可取的。在本文中，我们提出了一个资源选择器系统，它考虑了组织可能呈现的不同视图。该系统依赖于语义规则的混合集成方法，以实现不同本体之间的互操作性。实际实验结果表明，该系统成功地达到了目标。

引用次数: 0

Obtendo Desempenho Através de Mobilidade Forte de Código 通过强大的代码移动性获得性能

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18757

Gustavo Lermen, Fabiane Cristine Dillenburg, J. Barbosa

Dentre as propostas desenvolvidas para tirar proveito da heterogeneidade de dispositivos e sistemas operacionais disponíveis atualmente, encontra-se a mobilidade de código. Através da utilização de uma camada software subjacente em comum, este artigo apresenta uma solução que utiliza mobilidade de código para obter paralelismo na execução de tarefas. O modelo de mobilidade forte de código apresentado chama-se HoloGo. Este modelo utiliza como plataforma de execução uma máquina virtual, chamada HoloVM, que oferece suporte à programação concorrente e blackboards. A utilização do modelo proposto é materializada através da implementação de uma aplicação que visa o ganho de desempenho na execução de uma tarefa computacionalmente intensa.

在利用现有设备和操作系统的异构性而开发的建议中，有代码移动性。通过使用一个共同的底层软件层，本文提出了一种使用代码移动性来实现任务执行并行性的解决方案。提出的强代码移动性模型称为HoloGo。该模型使用一个名为HoloVM的虚拟机作为执行平台，该虚拟机支持并发编程和黑板。提出的模型的使用是通过实现一个应用程序来实现的，该应用程序旨在在执行计算密集型任务时获得性能。

引用次数: 0

Analisando a Predição de Desempenho com os Modelos Analíticos Gerados pela Metodologia PEMPIs-Het 用PEMPIs- heet方法生成的分析模型分析性能预测，并对其进行分析

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18765

J. M. Laine, Edson T. Midorikawa

Com o crescente uso da computação distribuída em ambientes heterogêneos, principalmente para processamento de alto desempenho, fica cada vez mais evidente a necessidade do desenvolvimento de metodologias e ferramentas específicas para análise, avaliação e predição de desempenho nestes ambientes. Embora existam vários trabalhos que propõem metodologias para este propósito, pouco ainda tem sido feito em ambientes heterogêneos. Motivados pela importância desta linha de pesquisa na computação de alto desempenho, desenvolvemos uma metodologia chamada PEMPIs-Het que faz uso de meta-modelos analíticos para modelar e estimar o desempenho de aplicações paralelas MPI em sistemas como clusters e grids computacionais. Neste artigo, avaliamos a aplicabilidade das técnicas que compõem a metodologia e a precisão das estratégias, tanto na predição de desempenho quanto na distribuição de cargas computacionais. Os resultados experimentais obtidos comprovaram a eficácia da modelagem e de sua aplicação na distribuição de carga em um estudo de caso realizado.

随着分布式计算在异构环境中的使用越来越多，特别是在高性能处理方面，越来越明显地需要开发方法和特定工具来分析、评估和预测这些环境中的性能。虽然有几项研究提出了为此目的的方法，但在异构环境中所做的工作很少。由于这一研究领域在高性能计算中的重要性，我们开发了一种名为PEMPIs-Het的方法，该方法使用分析元模型来建模和估计并行MPI应用程序在系统(如集群和计算网格)中的性能。在本文中，我们评估了构成该方法的技术的适用性和策略的准确性，包括性能预测和计算负载分布。在一个案例研究中，实验结果证明了该模型及其在负载分布中的应用的有效性。

引用次数: 1

Explorando o Espaço de Projeto com o Objetivo de Redução do Consumo de Energia usando Reduced Bit-width Instruction Set Architecture (rISA) 利用减少位宽指令集架构(rISA)探索设计空间以降低功耗

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18746

J. Silva, F. R. Wagner, Sandro Neves Soares

Este trabalho apresenta um framework para a exploração do espaço de projeto usando Reduced Bitwidth Instruction Set Architecture (rISA). rISA é um recurso arquitetural empregado para a redução de código e, também, para a redução do consumo de energia em processadores embarcados. O framework rISA herda, da sua infraestrutura de modelagem, recursos que o distinguem de outras ferramentas, relacionados à facilidade de acesso e de uso. Além disso, ele implementa um algoritmo de redução de código que tem, como diferencial, um tratamento mais eficiente dos desvios reduzidos. O uso deste framework permitiu a descoberta de um novo formato rISA, não considerado por outros trabalhos correlatos, que é mais simples e que apresenta melhores resultados do que outros conjuntos mais complexos em termos de redução no consumo de energia. A simplicidade deste novo formato advém do emprego de menos instruções no algoritmo de redução e os resultados obtidos, em experimentos com programas do MiBench, foram superiores a propostas anteriores em até 14%.

本文提出了一个使用简化位宽指令集体系结构(rISA)来探索设计空间的框架。rISA是一种用于减少代码和降低嵌入式处理器功耗的架构特性。rISA框架继承了其建模基础设施的特性，这些特性使它有别于其他工具，与访问和使用的便捷性有关。此外，它实现了一种代码约简算法，作为差分，更有效地处理减少的偏差。使用这个框架可以发现一种新的rISA格式，这是其他相关工作没有考虑到的，它更简单，在减少能源消耗方面比其他更复杂的集合显示更好的结果。这种新格式的简单性来自于在简化算法中使用更少的指令，在MiBench程序的实验中获得的结果比以前的建议高出14%。

{"title":"Explorando o Espaço de Projeto com o Objetivo de Redução do Consumo de Energia usando Reduced Bit-width Instruction Set Architecture (rISA)","authors":"J. Silva, F. R. Wagner, Sandro Neves Soares","doi":"10.5753/wscad.2007.18746","DOIUrl":"https://doi.org/10.5753/wscad.2007.18746","url":null,"abstract":"Este trabalho apresenta um framework para a exploração do espaço de projeto usando Reduced Bitwidth Instruction Set Architecture (rISA). rISA é um recurso arquitetural empregado para a redução de código e, também, para a redução do consumo de energia em processadores embarcados. O framework rISA herda, da sua infraestrutura de modelagem, recursos que o distinguem de outras ferramentas, relacionados à facilidade de acesso e de uso. Além disso, ele implementa um algoritmo de redução de código que tem, como diferencial, um tratamento mais eficiente dos desvios reduzidos. O uso deste framework permitiu a descoberta de um novo formato rISA, não considerado por outros trabalhos correlatos, que é mais simples e que apresenta melhores resultados do que outros conjuntos mais complexos em termos de redução no consumo de energia. A simplicidade deste novo formato advém do emprego de menos instruções no algoritmo de redução e os resultados obtidos, em experimentos com programas do MiBench, foram superiores a propostas anteriores em até 14%.","PeriodicalId":244503,"journal":{"name":"Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)","volume":"63 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2007-10-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"124420167","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Utilizando Adaptação Consciente da Aplicação No Acesso a Arquivos em um Ambiente Pervasivo 在普适环境中使用有意识的应用程序适应文件访问

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18758

G. Frainer, Luciano Cavalheiro da Silva, C. Geyer, Iara Augustin, Adenauer C. Yamin

O Espaço Pervasivo de Arquivos (EPA) é um serviço do middleware EXEHDA que provê acesso a arquivos de forma a implementar o conceito de semântica 'siga-me' das aplicações pervasivas. Esse serviço introduz um novo modelo para adaptação ciente da aplicação que fornece métodos para que as aplicações provejam informações específicas para guiar a adaptação ou estendam o EPA com módulos de aplicação que podem se adaptar a novos elementos de contexto. A combinação dessas duas estratégias permite que o modelo do EPA ultrapasse muitas das limitações apresentadas em trabalhos sobre sistemas de arquivos para computação pervasiva.

普惠文件空间(EPA)是一种EXEHDA中间件服务，它提供对文件的访问，以实现普惠应用程序的“跟随我”语义概念。该服务引入了一种新的应用程序感知自适应模型，为应用程序提供提供特定信息以指导自适应的方法，或使用应用程序模块扩展EPA，这些应用程序模块可以适应新的上下文元素。这两种策略的结合使EPA模型能够克服普惠计算文件系统工作中提出的许多限制。

引用次数: 0

Influência do Compartilhamento de Cache L2 em um Chip Multiprocessado sob Cargas de Trabalho com Conjuntos de Dados Contíguos e Não Contíguos 在具有连续和非连续数据集的工作负载下，多处理芯片上L2缓存共享的影响

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18749

Marco A. Z. Alves, H.C.F. Freitas, F. R. Wagner, P. Navaux

As diversas pesquisas e projetos de chips multiprocessados apontam na direção do uso da cache L2 compartilhada. No entanto, ainda está muito cedo para definir um modelo de compartilhamento à cache L2 que atenda às necessidades de desempenho dos futuros processadores multi-core. O objetivo deste artigo é apresentar resultados do projeto de um chip multiprocessado com vários agrupamentos de núcleos compartilhando a mesma cache L2 sob cargas de trabalho com conjuntos de dados contíguos e não contíguos. Os resultados apresentados mostram que a proximidade dos dados da aplicação paralela exerce forte influência sobre o desempenho nas diversas organizações de agrupamentos de processadores. Para a carga de trabalho com dados contíguos houve um aumento de desempenho de até 0,93% e uma redução na taxa de faltas da cache L2 de até 85,20% para leitura e aumento da taxa de faltas de até 59,07% para escrita. No conjunto de dados não contíguos houve uma degradação do desempenho de até 0,11%, mas com redução na taxa de faltas da cache L2 de até 82% para leitura e aumento na taxa de faltas para escrita de até 62,07%.

多处理芯片的各种研究和项目都指向共享L2缓存的使用方向。然而，现在定义一个L2缓存共享模型来满足未来多核处理器的性能需求还为时过早。本文的目的是介绍在连续和非连续数据集的工作负载下，具有多个核集群共享相同L2缓存的多处理芯片的设计结果。结果表明，并行应用程序数据的邻近性对各种处理器集群组织的性能有很大的影响。对于连续数据工作负载，性能提高了0.93%，L2缓存的读故障率降低了85.20%，写故障率提高了59.07%。在非连续数据集中，性能下降了0.11%，但L2缓存的读故障率降低了82%，写故障率提高了62.07%。

{"title":"Influência do Compartilhamento de Cache L2 em um Chip Multiprocessado sob Cargas de Trabalho com Conjuntos de Dados Contíguos e Não Contíguos","authors":"Marco A. Z. Alves, H.C.F. Freitas, F. R. Wagner, P. Navaux","doi":"10.5753/wscad.2007.18749","DOIUrl":"https://doi.org/10.5753/wscad.2007.18749","url":null,"abstract":"As diversas pesquisas e projetos de chips multiprocessados apontam na direção do uso da cache L2 compartilhada. No entanto, ainda está muito cedo para definir um modelo de compartilhamento à cache L2 que atenda às necessidades de desempenho dos futuros processadores multi-core. O objetivo deste artigo é apresentar resultados do projeto de um chip multiprocessado com vários agrupamentos de núcleos compartilhando a mesma cache L2 sob cargas de trabalho com conjuntos de dados contíguos e não contíguos. Os resultados apresentados mostram que a proximidade dos dados da aplicação paralela exerce forte influência sobre o desempenho nas diversas organizações de agrupamentos de processadores. Para a carga de trabalho com dados contíguos houve um aumento de desempenho de até 0,93% e uma redução na taxa de faltas da cache L2 de até 85,20% para leitura e aumento da taxa de faltas de até 59,07% para escrita. No conjunto de dados não contíguos houve uma degradação do desempenho de até 0,11%, mas com redução na taxa de faltas da cache L2 de até 82% para leitura e aumento na taxa de faltas para escrita de até 62,07%.","PeriodicalId":244503,"journal":{"name":"Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)","volume":"65 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2007-10-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"114907726","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

RSTm: Reusando Especulativamente Acessos à Memória RSTm:投机性重用内存访问

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

Pub Date : 2007-10-24 DOI: 10.5753/wscad.2007.18747

Luiz S. Laurino, P. Navaux, T. G. S. D. Santos, Maurício L. Pilla

Técnicas de reuso e previsão de valores são alternativas para aumentar o desempenho em arquiteturas de processadores, já que permitem que instruções com dependências verdadeiras e de controle tenham seus resultados no mesmo ciclo. No entanto, arquiteturas que utilizam esses mecanismos não costumam incorporar os acessos à memória como parte das instruções que podem ser reusadas. Neste artigo, o RSTm é apresentado, uma versão da arquitetura RST (Reuse through Speculation on Traces) que permite o reuso (especulativo ou não) de acessos à memória. A verificação da reusabilidade de instruções de acesso à memória dá-se com o uso de uma tabela adicional, a Memo Table L, que armazena endereços e valores dos acessos reusáveis. Esta solução não limita o número de instruções de acesso à memória por traço e, também, armazena tanto o endereço como seu respectivo valor, com pequeno custo adicional no hardware. Os experimentos, realizados com benchmarks do SPEC2000int e SPEC2000fp mostram um speedup de até 1,0474 no desempenho do RSTm sobre o mecanismo original e de 1,2019 sobre a arquitetura base.

重用和值预测技术是提高处理器体系结构性能的替代方案，因为它们允许具有真实和控制依赖关系的指令在同一周期内获得结果。然而，使用这些机制的体系结构通常不会将内存访问作为可重用指令的一部分。在本文中，我们介绍了RSTm，这是RST体系结构的一个版本，它允许内存访问的重用(推测的或非推测的)。内存访问指令的可重用性检查是通过使用一个额外的表Memo表L来完成的，该表存储可重用访问的地址和值。这种解决方案不限制每个字符的内存访问指令的数量，而且还存储地址及其各自的值，在硬件上几乎没有额外的成本。使用SPEC2000int和SPEC2000fp基准进行的实验表明，与原始机制相比，RSTm的性能加速高达1.0474，与基础架构相比，RSTm的性能加速高达1.2019。

{"title":"RSTm: Reusando Especulativamente Acessos à Memória","authors":"Luiz S. Laurino, P. Navaux, T. G. S. D. Santos, Maurício L. Pilla","doi":"10.5753/wscad.2007.18747","DOIUrl":"https://doi.org/10.5753/wscad.2007.18747","url":null,"abstract":"Técnicas de reuso e previsão de valores são alternativas para aumentar o desempenho em arquiteturas de processadores, já que permitem que instruções com dependências verdadeiras e de controle tenham seus resultados no mesmo ciclo. No entanto, arquiteturas que utilizam esses mecanismos não costumam incorporar os acessos à memória como parte das instruções que podem ser reusadas. Neste artigo, o RSTm é apresentado, uma versão da arquitetura RST (Reuse through Speculation on Traces) que permite o reuso (especulativo ou não) de acessos à memória. A verificação da reusabilidade de instruções de acesso à memória dá-se com o uso de uma tabela adicional, a Memo Table L, que armazena endereços e valores dos acessos reusáveis. Esta solução não limita o número de instruções de acesso à memória por traço e, também, armazena tanto o endereço como seu respectivo valor, com pequeno custo adicional no hardware. Os experimentos, realizados com benchmarks do SPEC2000int e SPEC2000fp mostram um speedup de até 1,0474 no desempenho do RSTm sobre o mecanismo original e de 1,2019 sobre a arquitetura base.","PeriodicalId":244503,"journal":{"name":"Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)","volume":"39 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2007-10-24","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"122566806","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

下一页尾页

类型

全部化学•材料生命科学医学物理工程技术环境•农林材料科学地球科学法学管理学化学环境科学与生态学计算机科学教育学经济学农林科学人文科学生物学数学物理与天体物理心理学综合性期刊其他工业工程理学历史学农学文学信息工程

数据库

全部 ACS Publications Elsevier ieeexplore Springer The Royal Society of Chemistry Wiley

期刊

Anais do VIII Workshop em Sistemas Computacionais de Alto Desempenho (WSCAD 2007)

全部 Acc. Chem. Res. ACS Applied Bio Materials ACS Appl. Electron. Mater. ACS Appl. Energy Mater. ACS Appl. Mater. Interfaces ACS Appl. Nano Mater. ACS Appl. Polym. Mater. ACS BIOMATER-SCI ENG ACS Catal. ACS Cent. Sci. ACS Chem. Biol. ACS Chemical Health & Safety ACS Chem. Neurosci. ACS Comb. Sci. ACS Earth Space Chem. ACS Energy Lett. ACS Infect. Dis. ACS Macro Lett. ACS Mater. Lett. ACS Med. Chem. Lett. ACS Nano ACS Omega ACS Photonics ACS Sens. ACS Sustainable Chem. Eng. ACS Synth. Biol. Anal. Chem. BIOCHEMISTRY-US Bioconjugate Chem. BIOMACROMOLECULES Chem. Res. Toxicol. Chem. Rev. Chem. Mater. CRYST GROWTH DES ENERG FUEL Environ. Sci. Technol. Environ. Sci. Technol. Lett. Eur. J. Inorg. Chem. IND ENG CHEM RES Inorg. Chem. J. Agric. Food. Chem. J. Chem. Eng. Data J. Chem. Educ. J. Chem. Inf. Model. J. Chem. Theory Comput. J. Med. Chem. J. Nat. Prod. J PROTEOME RES J. Am. Chem. Soc. LANGMUIR MACROMOLECULES Mol. Pharmaceutics Nano Lett. Org. Lett. ORG PROCESS RES DEV ORGANOMETALLICS J. Org. Chem. J. Phys. Chem. J. Phys. Chem. A J. Phys. Chem. B J. Phys. Chem. C J. Phys. Chem. Lett. Analyst Anal. Methods Biomater. Sci. Catal. Sci. Technol. Chem. Commun. Chem. Soc. Rev. CHEM EDUC RES PRACT CRYSTENGCOMM Dalton Trans. Energy Environ. Sci. ENVIRON SCI-NANO ENVIRON SCI-PROC IMP ENVIRON SCI-WAT RES Faraday Discuss. Food Funct. Green Chem. Inorg. Chem. Front. Integr. Biol. J. Anal. At. Spectrom. J. Mater. Chem. A J. Mater. Chem. B J. Mater. Chem. C Lab Chip Mater. Chem. Front. Mater. Horiz. MEDCHEMCOMM Metallomics Mol. Biosyst. Mol. Syst. Des. Eng. Nanoscale Nanoscale Horiz. Nat. Prod. Rep. New J. Chem. Org. Biomol. Chem. Org. Chem. Front. PHOTOCH PHOTOBIO SCI PCCP Polym. Chem.

﹀