Yolanda Flores Salgado, Silvia Elizabeth Fraustto del Río, Joel Ireta Moreno, Leobardo Itehua Rico, Héctor Manuel Oliver Hernández, Eduardo Iván Ortega Alarcón, Eduardo Romero Arzate
{"title":"Configuración de un cluster confederado para HPC con SLURM","authors":"Yolanda Flores Salgado, Silvia Elizabeth Fraustto del Río, Joel Ireta Moreno, Leobardo Itehua Rico, Héctor Manuel Oliver Hernández, Eduardo Iván Ortega Alarcón, Eduardo Romero Arzate","doi":"10.22201/dgtic.26832968e.2022.5.4","DOIUrl":null,"url":null,"abstract":"El Laboratorio Nacional de Cómputo de Alto Desempeño (LANCAD) es un consorcio conformado por tres instituciones con amplia experiencia en supercómputo: el Centro de Investigación y Estudios Avanzados del IPN (Cinvestav), la Universidad Autónoma Metropolitana (UAM) y la Universidad Nacional Autónoma de México (UNAM). LANCAD se creó con el objetivo de apoyar la investigación científica nacional proporcionando servicios de cómputo de alto desempeño (CAD). Con la finalidad de explorar la integración de equipos de cómputo instalados en cada uno de los centros, el grupo técnico del LANCAD desarrolló un prototipo de cluster (1) confederado para que los usuarios ejecuten procesos indistintamente en cualquiera de los clusters CAD que lo conforman en un ambiente estandarizado. El presente artículo resume las experiencias que generó la implementación de la federación de clusters mediante el uso de Slurm Federated Scheduling, así como los retos que surgieron para su construcción, validación y pruebas.","PeriodicalId":287597,"journal":{"name":"TIES, Revista de Tecnología e Innovación en Educación Superior","volume":"104 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-06-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"TIES, Revista de Tecnología e Innovación en Educación Superior","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.22201/dgtic.26832968e.2022.5.4","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Configuración de un cluster confederado para HPC con SLURM
El Laboratorio Nacional de Cómputo de Alto Desempeño (LANCAD) es un consorcio conformado por tres instituciones con amplia experiencia en supercómputo: el Centro de Investigación y Estudios Avanzados del IPN (Cinvestav), la Universidad Autónoma Metropolitana (UAM) y la Universidad Nacional Autónoma de México (UNAM). LANCAD se creó con el objetivo de apoyar la investigación científica nacional proporcionando servicios de cómputo de alto desempeño (CAD). Con la finalidad de explorar la integración de equipos de cómputo instalados en cada uno de los centros, el grupo técnico del LANCAD desarrolló un prototipo de cluster (1) confederado para que los usuarios ejecuten procesos indistintamente en cualquiera de los clusters CAD que lo conforman en un ambiente estandarizado. El presente artículo resume las experiencias que generó la implementación de la federación de clusters mediante el uso de Slurm Federated Scheduling, así como los retos que surgieron para su construcción, validación y pruebas.