Solving the C-Shaped Ring Type Patience Cube as Planning Problem

Ji-Hyeon Yoo, Ho-Jin Jung, Janghyeon Kim, Dae-Han Sim, Song-Woo Kim, KwangEun Ko, Han Ul Yoon
{"title":"Solving the C-Shaped Ring Type Patience Cube as Planning Problem","authors":"Ji-Hyeon Yoo, Ho-Jin Jung, Janghyeon Kim, Dae-Han Sim, Song-Woo Kim, KwangEun Ko, Han Ul Yoon","doi":"10.5391/jkiis.2023.33.5.477","DOIUrl":null,"url":null,"abstract":"정확한 힘과 방향을 요구하는 작업이 주어졌을 때, 사람은 강화학습과 유사한 휴리스틱 방법론을 통해 작업을 수행한다. 따라서, 이러한 사람의 의사결정-조작의 과정을 강화학습으로 구현하여 로봇에게 적용하여준다면 정교한 손동작이 요구되는 작업을 성공적으로 수행할 수 있을 것으로 기대할 수 있다. 본 논문은 사람의 정교한 손놀림이 요구되는 C형 고리 patience cube를 로봇으로 해결하기 위한 강화학습 기반 플래너 설계 기법을 제안한다. 먼저 두 축을 기준으로 회전하는 평평한 판과 그 위에서 구르는 공에 대한 운동 방정식을 구하였다. 이후, C형 고리 patience cube 문제를 C형 고리의 입구로 공을 가져오는 플래닝 문제와 그 영역으로부터 공을 고리 안으로 넣는 플래닝 문제로 구성하였다. 이어서, 각 플래닝 문제를 해결하기 위한 마르코프 의사 결정(MDP) 튜플(상태, 행동, 보상)을 정의하였다. 에이전트(플래너)는 가상환경에서 강화학습 알고리즘(PPO)을 통해 학습되었다. 결과적으로, 가상환경에서 학습된 에이전트가 가상환경에서 C형 고리 patience cube문제를 잘 해결할 수 있음을 확인하였다. 또한, 실제 환경의 양팔 로봇에 이식하였을 때도 주어진 C형 고리 patience cube 문제를 해결할 수 있음을 확인하였다. 이를 통해, 본 논문에서 제안된 방법론으로, 다양한 정교한 손동작 문제를 kinodynamic 플래닝 문제로 정의하여 해결할 수 있는 가능성을 보였다.","PeriodicalId":17349,"journal":{"name":"Journal of The Korean Institute of Intelligent Systems","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of The Korean Institute of Intelligent Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5391/jkiis.2023.33.5.477","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

정확한 힘과 방향을 요구하는 작업이 주어졌을 때, 사람은 강화학습과 유사한 휴리스틱 방법론을 통해 작업을 수행한다. 따라서, 이러한 사람의 의사결정-조작의 과정을 강화학습으로 구현하여 로봇에게 적용하여준다면 정교한 손동작이 요구되는 작업을 성공적으로 수행할 수 있을 것으로 기대할 수 있다. 본 논문은 사람의 정교한 손놀림이 요구되는 C형 고리 patience cube를 로봇으로 해결하기 위한 강화학습 기반 플래너 설계 기법을 제안한다. 먼저 두 축을 기준으로 회전하는 평평한 판과 그 위에서 구르는 공에 대한 운동 방정식을 구하였다. 이후, C형 고리 patience cube 문제를 C형 고리의 입구로 공을 가져오는 플래닝 문제와 그 영역으로부터 공을 고리 안으로 넣는 플래닝 문제로 구성하였다. 이어서, 각 플래닝 문제를 해결하기 위한 마르코프 의사 결정(MDP) 튜플(상태, 행동, 보상)을 정의하였다. 에이전트(플래너)는 가상환경에서 강화학습 알고리즘(PPO)을 통해 학습되었다. 결과적으로, 가상환경에서 학습된 에이전트가 가상환경에서 C형 고리 patience cube문제를 잘 해결할 수 있음을 확인하였다. 또한, 실제 환경의 양팔 로봇에 이식하였을 때도 주어진 C형 고리 patience cube 문제를 해결할 수 있음을 확인하였다. 이를 통해, 본 논문에서 제안된 방법론으로, 다양한 정교한 손동작 문제를 kinodynamic 플래닝 문제로 정의하여 해결할 수 있는 가능성을 보였다.
查看原文
分享 分享
微信好友 朋友圈 QQ好友 复制链接
本刊更多论文
求解c型环形耐心立方体规划问题
当被赋予要求正确的力量和方向的工作时,人就会通过类似强化学习的启发方法论来完成工作。因此,如果将这种人的决策-操作过程体现为强化学习,并应用于机器人,就可以期待成功完成需要精巧手动作的工作。本论文提出了用机器人解决需要人精巧手法的C型环patience cube的强化学习基础规划设计技法。首先求出以两个轴为基准旋转的平坦板和在上面滚动的球的运动方程。此后,C型环patience cube问题由将球从C型环入口引到球的规划问题和将球从该区域引到环内的规划问题组成。随后,他定义了马尔科夫决策(MDP)协调(状态、行动和补偿)来解决每个规划问题。经纪人(planner)是在虚拟环境中通过强化学习算法(PPO)学习的。结果,在虚拟环境中学习的代理可以很好地解决虚拟环境中的C型环patience cube问题。此外,移植到实际环境中的双臂机器人中,也可以解决C型环patience cube问题。通过这篇论文提出的方法论,可以将各种精巧的手部动作问题定义为kinodynamic规划问题来解决。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 去求助
来源期刊
自引率
0.00%
发文量
0
期刊最新文献
A study on U-Net based Deblurring Stability for Autonomous Operation Comparison of Deep learning based Semantic Segmentation Model for Offroad Self-driving Solving the C-Shaped Ring Type Patience Cube as Planning Problem Addressing Class Imbalance in Multiple Causal Relations and Keyword Network for Maritime Safety Management A Real-time System for Judging Vehicle Loads and Overloaded using Yolo with Post-Processing Algorithm
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
现在去查看 取消
×
提示
确定
0
微信
客服QQ
Book学术公众号 扫码关注我们
反馈
×
意见反馈
请填写您的意见或建议
请填写您的手机或邮箱
已复制链接
已复制链接
快去分享给好友吧!
我知道了
×
扫码分享
扫码分享
Book学术官方微信
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术
文献互助 智能选刊 最新文献 互助须知 联系我们:info@booksci.cn
Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。
Copyright © 2023 Book学术 All rights reserved.
ghs 京公网安备 11010802042870号 京ICP备2023020795号-1