LEARNING开放获取
PhysBrain 1.0技术报告
Shijie Lian, Bin Yu, Xiaopeng Lin, Changti Wu, Hang Yuan, Xiaolin Hu, Zhaolong Shen, Yuzhuo Miao, Haishan Liu, Yuxuan Tian, Yukun Shi, Cong Huang, Kai Chen
2026
摘要
该论文提出PhysBrain 1.0,通过将大规模人类自我中心视频转化为结构化物理常识监督,训练视觉-语言-动作模型,并在多模态问答和具身控制基准上取得最先进结果。其核心创新在于利用人类交互视频中的物理先验知识,有效桥接了多模态理解与机器人动作执行之间的鸿沟。
关键词
vision-language-actionphysical commonsensehuman egocentric videoVLA policyout-of-domain
相关论文
LEARNING
开放获取📊 1 引用
面向学习与规划的并行可微可达性:具有认证神经动力学与控制器的系统
Keyi Shen, Glen Chou
2026
LEARNING
📊 0 引用
基于深度强化学习和动态图神经网络的多任务机器人调度代理
Hedi Boukamcha, Anas Neumann, Monia Rekik 等 6 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
人工智能增强的智能焊接岛:基础模型革新制造业
Xiwei Wu, Wei Wu, Qiqi Chen 等 9 位作者
Robotics and Computer-Integrated Manufacturing · 2026
LEARNING
📊 0 引用
基于微调与AAS增强检索的LLM驱动自动化DFA评估
Jiaxin Liu, Xiaofeng Zhou, Suyang Yu 等 8 位作者
Robotics and Computer-Integrated Manufacturing · 2026