OTHER开放获取
面向检索代理的自然语言查询到配置的转换
Melissa Z. Pan, Negar Arabzadeh, Mathew Jacob, Fiodar Kazhamiaka, Esha Choukse, Matei Zaharia
2026
摘要
本文提出了BRANE系统,利用大语言模型将自然语言查询转换为工作负载特征,并训练轻量级预测器来估计不同管道配置的正确性,从而在推理时根据准确率或预算目标选择最优配置。实验表明,BRANE在多个基准测试中实现了成本-质量帕累托前沿的改进,相比固定配置可降低高达89%的成本。
关键词
retrieval agentsconfiguration optimizationcost-quality tradeoffLLM routinginference-time selection
相关论文
OTHER
📊 1 引用
一种面向线弧增材制造的电动汽车结构可制造性拓扑优化的双环框架
Qiang Cui, Chuan Yu, Daoqian Yang 等 5 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
几何数字孪生:一种用于航空发动机装配精度预测的数字智能模型
Ke Shang, Xin Jin, Teli Xu 等 7 位作者
Robotics and Computer-Integrated Manufacturing · 2026
OTHER
📊 0 引用
通过人工智能驱动的机器人技术革新产业
Aryan Chaudhary
Recent Advances in Computer Science and Communications · 2026
OTHER
📊 0 引用
新型大口径偏置馈电可展开天线设计与动态性能预测
Chuang Shi, Tianming Liu, Ning Xue 等 9 位作者
Aerospace Science and Technology · 2026