首页 /研究 /用于偏好学习的主动查询合成
LEARNING开放获取📊 0 引用

用于偏好学习的主动查询合成

Namrata Nadagouda, Nauman Ahad, Maegan Tucker, Mark A. Davenport

2026

摘要

本文提出了一种名为Info-Synth的主动查询合成框架,通过最大化连续空间中的互信息目标来生成最优查询,从而解决偏好学习中的标签成本问题。同时,引入了置信度感知的响应模型,以处理模糊比较带来的低置信度反馈,并提出了两种策略扩展至有限查询池场景。

关键词

active learningpreference learningquery synthesisconfidence-awaremutual information

相关论文