PERCEPTION开放获取
SpeakerLLM:面向说话者理解与验证推理的说话者专用音频大语言模型
KiHyun Nam, Jungwoo Heo, Siu Bae, Ha-Jin Yu, Joon Son Chung
2026
摘要
本文提出SpeakerLLM框架,将说话者特征提取、录音条件理解、说话者比较与验证推理统一到自然语言界面中。该模型通过结构化证据追踪和决策组合策略,实现了超越传统二元标签的细粒度说话者分析与可解释验证。
关键词
speaker verificationaudio-LLMnatural language interfacespeaker profilingreasoning
相关论文
PERCEPTION
开放获取📊 4 引用
如何缓解越野环境中语义分割的分布偏移
Ji-Hoon Hwang, Daeyoung Kim, Hyung-Suk Yoon 等 5 位作者
2026
PERCEPTION
📊 0 引用
基于原型模糊推理与证据融合的不确定性引导工业机器人可进化识别框架
Yanrun Zhou, Zihao Lei, Guangrui Wen 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
PERCEPTION
📊 0 引用
基于点云配准的非破坏性高分辨率涂层厚度三维扫描测量
Simon Duenser, Ivo Aschwanden, Raamadaas Krishnadas 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
PERCEPTION
📊 0 引用
迈向智能机器人时代:用于高级感知系统的多模态柔性触觉传感器
Sili Ding, Feng Xu, Jie Chen 等 6 位作者
Progress in Materials Science · 2026