2026 年第 11 周 AI 论文热点:强化学习扩展到更多应用边界,从语言反馈到 3D 编辑与 Agent 在线学习

本周高热论文中,强化学习相关工作占据前列,应用边界从对齐扩展到 3D 编辑与 Agent 在线学习;开源搜索代理的训练门槛正在下降;推理过程对模型内部知识调用的影响获得新的理论解释。