首页 /研究 /通过摊销基于样本的变分推断来对齐少步生成模型
LEARNING开放获取📊 0 引用

通过摊销基于样本的变分推断来对齐少步生成模型

Jaewoo Lee, Hyeongyu Kang, Dohyun Kim, Kyuil Sim, Woocheol Shin, Minsu Kim, Taeyoung Yun, Jeongjae Lee, Sanghyeok Choi, Tabitha Edith Lee, Jongchul Ye, Jinkyoo Park

2026

摘要

本文提出FAV框架,通过将对齐问题转化为从奖励倾斜分布中采样,并利用Stein变分梯度下降进行样本推理,再通过不动点回归将粒子更新摊销到生成器参数中,从而实现对少步生成模型的一般性对齐。在机器人操作策略对齐和图像生成器对齐任务上,FAV均优于现有基线方法。

关键词

few-step generative modelalignmentvariational inferenceStein Variational Gradient Descentrobotics manipulationimage generation

相关论文