首页 /研究 /面向第一人称操作的视觉轨迹预测的空间提示方法

MANIPULATION

面向第一人称操作的视觉轨迹预测的空间提示方法

Yifan Li, Xinyu Zhou, Yunhao Ge, Yu Kong

发表年份: 2026
访问权限: 开放获取

摘要

本文首次形式化定义了空间提示视觉轨迹预测（SP-VTP）问题，通过初始空间提示（如边界框或点）指定任务目标，从第一人称视频流中预测未来末端执行器轨迹。提出了SPOT模型，结合任务编码器、观测编码器和轨迹生成器，在跨场景轨迹预测上优于非提示或单源提示基线。

关键词

spatial promptingvisual trajectory predictionegocentric manipulationobject-target groundingend-effector motion forecasting

相关论文

MANIPULATION

📊 7,533 引用

Real-Time Obstacle Avoidance for Manipulators and Mobile Robots

Oussama Khatib

1986

MANIPULATION

📊 6,720 引用

A Mathematical Introduction to Robotic Manipulation

Richard M. Murray, Zexiang Li, Shankar Sastry

2017

MANIPULATION

📊 3,821 引用

Robot dynamics and control

Mark W. Spong

1989

MANIPULATION

📊 3,499 引用

A tutorial on visual servo control

Seth Hutchinson, Gregory D. Hager, Peter Corke

1996

查看 MANIPULATION 分类全部论文