Regularized Least Squares Temporal Difference Learning with Nested ℓ2 and ℓ1 Penalization

European Workshop on Reinforcement Learning Pub Date : 2011-09-09 DOI:10.1007/978-3-642-29946-9_13

Matthew W. Hoffman, A. Lazaric, M. Ghavamzadeh, R. Munos

引用次数: 51

查看原文

微信好友朋友圈 QQ好友复制链接

本刊更多论文

正则化最小二乘时间差分学习与嵌套l_1和l_2惩罚

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文去求助

来源期刊

European Workshop on Reinforcement Learning

自引率

0.00%

发文量

期刊最新文献

求助内容：

标题：

DOI：

期刊：

作者：

出版日期：

数据库：

积分：

文献类型：期刊论文学位论文图书其他 (专利、报告等)

补充材料：只需要正文仅需补充材料注：不可同时求助正文和补充材料，需分开求助。

应助结果提醒方式：

微信（请自行确认已关注Book学术公众号）

邮件

确认发布求助