首页 /研究 /PointACT：具有多尺度点-动作交互的视觉-语言-动作模型

MANIPULATION

PointACT：具有多尺度点-动作交互的视觉-语言-动作模型

Shizhe Chen, Paul Pacaud, Cordelia Schmid

发表年份: 2026
访问权限: 开放获取

摘要

PointACT提出一种双系统3D感知VLA策略，通过多尺度点-动作交互机制将分层3D点云表示直接集成到动作解码中。在LIBERO和RLBench基准上，该方法相比现有VLA基线取得了显著改进，尤其是在冻结视觉-语言骨干时优势更大。

关键词

VLA3D point cloudmulti-scale attentionrobot manipulationdual-system

相关论文

MANIPULATION

📊 7,533 引用

Real-Time Obstacle Avoidance for Manipulators and Mobile Robots

Oussama Khatib

1986

MANIPULATION

📊 6,720 引用

A Mathematical Introduction to Robotic Manipulation

Richard M. Murray, Zexiang Li, Shankar Sastry

2017

MANIPULATION

📊 3,821 引用

Robot dynamics and control

Mark W. Spong

1989

MANIPULATION

📊 3,499 引用

A tutorial on visual servo control

Seth Hutchinson, Gregory D. Hager, Peter Corke

1996

查看 MANIPULATION 分类全部论文