首页 /研究 /面向场景图生成的依赖感知离散扩散模型
LEARNING开放获取

面向场景图生成的依赖感知离散扩散模型

Rajalaxmi Rajagopalan, Romit Roy Choudhury

2026

摘要

该论文提出了一种依赖感知的层次约束离散扩散模型,用于从自然语言生成场景图。该方法通过解耦结构和语义,捕捉对象、边和关系之间的条件依赖,并在推理时进行无训练条件采样,显著提升了场景图生成的性能。

关键词

scene graph generationdiscrete diffusionnatural languagehierarchical structuredependency-aware

相关论文