通过摊销基于样本的变分推断来对齐少步生成模型

Jaewoo Lee, Hyeongyu Kang, Dohyun Kim, Kyuil Sim, Woocheol Shin, Minsu Kim, Taeyoung Yun, Jeongjae Lee, Sanghyeok Choi, Tabitha Edith Lee, Jongchul Ye, Jinkyoo Park

发表年份: 2026
引用次数: 0
访问权限: 开放获取

摘要

本文提出FAV框架，通过将对齐问题转化为从奖励倾斜分布中采样，并利用Stein变分梯度下降进行样本推理，再通过不动点回归将粒子更新摊销到生成器参数中，从而实现对少步生成模型的一般性对齐。在机器人操作策略对齐和图像生成器对齐任务上，FAV均优于现有基线方法。

关键词

few-step generative modelalignmentvariational inferenceStein Variational Gradient Descentrobotics manipulationimage generation

通过摊销基于样本的变分推断来对齐少步生成模型

摘要

关键词

相关论文

The Organization of Behavior

Fractional Brownian Motions, Fractional Noises and Applications

Review of deep learning: concepts, CNN architectures, challenges, applications, future directions

A guide to deep learning in healthcare