Policy learning

顶级研究者

Marc Peter Deisenroth

研究机构: —

Wolfram Burgard

研究机构: —

Sonia Chernova

研究机构: —

Sergey Levine

研究机构: —

Pieter Abbeel

研究机构: —

Jens Kober

研究机构: —

Jan Peters

研究机构: —

Li Fei-Fei

研究机构: —

Dieter Fox

研究机构: —

Honglak Lee

研究机构: —

顶尖机构

Technische Universität DarmstadtDE3 篇论文 Max Planck SocietyDE3 篇论文 The University of Texas at AustinUS3 篇论文 Google (United States)US2 篇论文 University of WashingtonUS2 篇论文 Universidade de São PauloBR2 篇论文 Shanghai Jiao Tong UniversityCN2 篇论文 University of Illinois Urbana-ChampaignUS2 篇论文

最高引用论文

A Survey on Policy Search for Robotics

Marc Peter Deisenroth

引用数: 684 • 2011

Data-Efficient Hierarchical Reinforcement Learning

Ofir Nachum, Shixiang Gu, Honglak Lee, Sergey Levine

引用数: 265 • 2018

Transfer via inter-task mappings in policy search reinforcement learning

Matthew E. Taylor, Shimon Whiteson, Peter Stone

引用数: 133 • 2007

Multi-task policy search for robotics

Marc Peter Deisenroth, Péter Englert, Jan Peters, Dieter Fox

引用数: 121 • 2014

Effect of human guidance and state space size on Interactive Reinforcement Learning

Halit Bener Suay, Sonia Chernova

引用数: 118 • 2011

Interactive Learning from Policy-Dependent Human Feedback

James MacGlashan, Mark K. Ho, Robert Loftin, Bei Peng, Guan Wang, David L. Roberts, Matthew E. Taylor, Michael L. Littman

引用数: 108 • 2017

Preference-Based Policy Learning

Riad Akrour, Marc Schoenauer, Michèle Sébag

引用数: 83 • 2011

Explanation-Based Reward Coaching to Improve Human Performance via Reinforcement Learning

Aaquib Tabrez, Shivendra Agrawal, Bradley Hayes

引用数: 62 • 2019

Stochastic Abstract Policies: Generalizing Knowledge to Improve Reinforcement Learning

Marcelo Li Koga, Valdinei Freire, Anna Helena Reali Costa

引用数: 45 • 2014

A residual reinforcement learning method for robotic assembly using visual and force information

Zhuangzhuang Zhang, Yizhao Wang, Zhinan Zhang, Lihui Wang, Huang Huang, Qixin Cao

引用数: 40 • 2023

Any-point Trajectory Modeling for Policy Learning

Xingyu Lin, John So, Kai Chen, Qi Dou, Yang Gao, Pieter Abbeel

引用数: 40 • 2024

Reinforcement Learning for Pivoting Task

Rika Antonova, Silvia Cruciani, Christian Smith, Danica Kragić

引用数: 36 • 2017

Affordance Learning from Play for Sample-Efficient Policy Learning

Jessica Borja-Diaz, Oier Mees, Gabriel Kalweit, Lukás Hermann, Joschka Boedecker, Wolfram Burgard

引用数: 29 • 2022

Velocity adaptation for self-improvement of skills learned from user demonstrations

Bojan Nemec, Andrej Gams, Aleš Ude

引用数: 28 • 2013

GAPLE: Generalizable Approaching Policy LEarning for Robotic Object Searching in Indoor Environment

Xin Ye, Zhe Lin, Joon‐Young Lee, Jianming Zhang, Shibin Zheng, Yezhou Yang

引用数: 26 • 2019

Transfer Learning for Policy Search Methods

Shimon Whiteson

引用数: 25 • 2006

Sample and time efficient policy learning with CMA-ES and Bayesian Optimisation

Léni K. Le Goff, Edgar Buchanan, Emma Hart, A. E. Eiben, Wei Li, Matteo De Carlo, Matthew F. Hale, Mike Angus, Robert Woolley, Jon Timmis, Alan Winfield, Andrew M. Tyrrell

引用数: 20 • 2020

Learning policies for attentional control

Luiz Marcos Garcia Gonçalves, Gilson A. Giraldi, Antonio A. F. Oliveira, Roderic A. Grupen

引用数: 15 • 2003

Interaction-Aware Multi-Agent Reinforcement Learning for Mobile Agents with Individual Goals

Anahita Mohseni-Kabir, David Isele, Kikuo Fujimura

引用数: 14 • 2019

Learning Environmental Calibration Actions for Policy Self-Evolution

Chao Zhang, Yang Yu, Zhi‐Hua Zhou

引用数: 13 • 2018

Policy learning

顶级研究者

顶尖机构

最高引用论文

相关技术