首页 /研究 /RoboSurg-VQA:面向手术分割感知的视觉问答多模态基准
SURGICAL开放获取

RoboSurg-VQA:面向手术分割感知的视觉问答多模态基准

Chengyi Zhang, Zi Ye, Ziyang Wang

2026

摘要

该论文提出了RoboSurg-VQA,一个将公开手术分割数据集重新用于分割感知视觉问答的基准,每个帧都配有一组临床驱动的问题。通过约束提示和人工审核生成候选答案,并报告了在挑战性手术条件下的基准统计和评估挑战。

关键词

visual question answeringsurgical segmentationrobot-assisted surgerymultimodal benchmarkminimally invasive surgery