利用马尔可夫模型对毫米波多载波无线系统资源调度的强化学习

Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021) Pub Date : 2021-10-25 DOI:10.5753/erigo.2021.18430

Daniel Porto Queiroz Carneiro, Á. Cardoso, Cláudio Gabriel Lemos de Almeida, F. Vieira

{"title":"利用马尔可夫模型对毫米波多载波无线系统资源调度的强化学习","authors":"Daniel Porto Queiroz Carneiro, Á. Cardoso, Cláudio Gabriel Lemos de Almeida, F. Vieira","doi":"10.5753/erigo.2021.18430","DOIUrl":null,"url":null,"abstract":"Neste artigo, apresenta-se um algoritmo de alocação de recursos baseado em aprendizado por reforço para um sistema de comunicação multiportadora considerando múltiplos usuários e efeitos de desvanecimento e multipercurso em uma transmissão assumindo ondas milimétricas. Para tal, propõe-se que o sistema de comunicação possa ser descrito por um modelo Markoviano representado pelos estados da fila nos buffers e estados dos canais. Para o algoritmo de alocação de recursos deste trabalho, introduzimos uma função de recompensa a ser utilizada no algoritmo de aprendizado por reforço Q-learning. Os resultados obtidos nas simulações mostram que a aplicação do algoritmo proposto de escalonamento de recursos provê de forma geral, melhoria nos parâmetros de desempenho do sistema de comunicação considerado, como por exemplo, aumento de vazão e diminuição de perda de pacotes. Comparações com outros algoritmos apresentados na literatura são realizadas, mostrando também que o uso da função de recompensa e o modelo Markoviano propostos torna o escalonamento de usuários e o compartilhamento de recursos mais eficientes.","PeriodicalId":125727,"journal":{"name":"Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)","volume":"311 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2021-10-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Aprendizado por Reforço para Escalonamento de Recursos em Sistema sem Fio Multiportadora com Ondas Milimétricas Utilizando Modelo Markoviano\",\"authors\":\"Daniel Porto Queiroz Carneiro, Á. Cardoso, Cláudio Gabriel Lemos de Almeida, F. Vieira\",\"doi\":\"10.5753/erigo.2021.18430\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Neste artigo, apresenta-se um algoritmo de alocação de recursos baseado em aprendizado por reforço para um sistema de comunicação multiportadora considerando múltiplos usuários e efeitos de desvanecimento e multipercurso em uma transmissão assumindo ondas milimétricas. Para tal, propõe-se que o sistema de comunicação possa ser descrito por um modelo Markoviano representado pelos estados da fila nos buffers e estados dos canais. Para o algoritmo de alocação de recursos deste trabalho, introduzimos uma função de recompensa a ser utilizada no algoritmo de aprendizado por reforço Q-learning. Os resultados obtidos nas simulações mostram que a aplicação do algoritmo proposto de escalonamento de recursos provê de forma geral, melhoria nos parâmetros de desempenho do sistema de comunicação considerado, como por exemplo, aumento de vazão e diminuição de perda de pacotes. Comparações com outros algoritmos apresentados na literatura são realizadas, mostrando também que o uso da função de recompensa e o modelo Markoviano propostos torna o escalonamento de usuários e o compartilhamento de recursos mais eficientes.\",\"PeriodicalId\":125727,\"journal\":{\"name\":\"Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)\",\"volume\":\"311 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2021-10-25\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/erigo.2021.18430\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/erigo.2021.18430","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

本文提出了一种基于强化学习的多载波通信系统资源分配算法，该算法考虑了多用户、衰落和多路径效应，假设毫米波传输。为此，我们提出通信系统可以用一个马尔可夫模型来描述，该模型由缓冲区中的队列状态和信道状态表示。对于资源分配算法，我们引入了一个奖励函数，用于Q-learning强化学习算法。仿真结果表明，所提出的资源调度算法的应用总体上改善了通信系统的性能参数，如增加吞吐量和减少丢包。与文献中提出的其他算法进行了比较，并证明了奖励函数和马尔可夫模型的使用使用户调度和资源共享更加有效。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

Aprendizado por Reforço para Escalonamento de Recursos em Sistema sem Fio Multiportadora com Ondas Milimétricas Utilizando Modelo Markoviano

Neste artigo, apresenta-se um algoritmo de alocação de recursos baseado em aprendizado por reforço para um sistema de comunicação multiportadora considerando múltiplos usuários e efeitos de desvanecimento e multipercurso em uma transmissão assumindo ondas milimétricas. Para tal, propõe-se que o sistema de comunicação possa ser descrito por um modelo Markoviano representado pelos estados da fila nos buffers e estados dos canais. Para o algoritmo de alocação de recursos deste trabalho, introduzimos uma função de recompensa a ser utilizada no algoritmo de aprendizado por reforço Q-learning. Os resultados obtidos nas simulações mostram que a aplicação do algoritmo proposto de escalonamento de recursos provê de forma geral, melhoria nos parâmetros de desempenho do sistema de comunicação considerado, como por exemplo, aumento de vazão e diminuição de perda de pacotes. Comparações com outros algoritmos apresentados na literatura são realizadas, mostrando também que o uso da função de recompensa e o modelo Markoviano propostos torna o escalonamento de usuários e o compartilhamento de recursos mais eficientes.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Anais da IX Escola Regional de Informática de Goiás (ERI-GO 2021)

自引率

0.00%

发文量