SURGICAL开放获取
RoboSurg-VQA:面向手术分割感知的视觉问答多模态基准
Chengyi Zhang, Zi Ye, Ziyang Wang
2026
摘要
该论文提出了RoboSurg-VQA,一个将公开手术分割数据集重新用于分割感知视觉问答的基准,每个帧都配有一组临床驱动的问题。通过约束提示和人工审核生成候选答案,并报告了在挑战性手术条件下的基准统计和评估挑战。
关键词
visual question answeringsurgical segmentationrobot-assisted surgerymultimodal benchmarkminimally invasive surgery