博客 - 每周 AI 论文热点

2026-06-29 W26 周报 8 篇精选

Qwen-AgentWorld / Agent-Native Memory / Wan-Streamer — 2026 W26 AI 论文周报（8 篇精选）

Qwen-AgentWorld 语言世界模型、Agent-Native Memory 系统化评估、Wan-Streamer 流式多模态、EnterpriseClawBench 真实企业评测、NatureBench 科研复现、EDV 自验证训练范式、In-Context World Modeling 机器人控制、KaLM-Reranker RAG 压缩等 8 篇热门论文趋势解读。

Agent世界模型 Agent记忆系统 Agent评测 On-Policy训练流式多模态 In-Context学习

2026-05-31 W22 周报 8 篇精选

Gamma-World / DVAO / AgentDoG — 2026 W22 AI 论文周报（8 篇精选）

Gamma-World 多智能体世界模型、DVAO 多奖励 RL、LocateAnything 并行视觉定位、AgentDoG 1.5 Agent 安全、WBench 世界模型评测、Qwen-VLA 跨载体机器人、AXPO Agent 工具使用、Macaron-A2UI 生成式 UI 等 8 篇热门论文趋势解读。

多智能体世界模型多奖励强化学习 Agent安全 VLA机器人生成式UI 视觉定位

W20-W21 AI 论文半月版封面：可信文档证据溯源与 token 级信用分配

2026-05-23 W20-W21 半月版 8 篇精选

CiteVQA / Code as Agent Harness / Anti-Self-Distillation — 2026 W20-W21 AI 论文半月版（8 篇精选）

CiteVQA 可信文档评测、MinT 百万级 LoRA 托管、Code as Agent Harness 代码即基座、Anti-Self-Distillation 反向自蒸馏、SenseNova-U1 多模态统一、奥赛金牌级推理、Video2GUI 轨迹合成、DelTA token 级信用分配等 8 篇热门论文趋势解读。

可信文档智能评测基准强化学习后训练 token信用分配 Agent基础设施多模态统一

2026-05-11 W18-W19 半月版 8 篇精选

MolmoAct2 / RecursiveMAS / Stream-R1 — 2026 W18-W19 AI 论文半月版（8 篇精选）

MolmoAct2 可部署 VLA、Eywa 异构科学协作、RecursiveMAS 递归多智能体、Ctx2Skill 上下文技能、Stream-R1 流式视频蒸馏、World-R1 3D 约束 RL、RLDX-1 灵巧操作、ARIS 对抗式自主研究等 8 篇热门论文趋势解读。

VLA机器人多智能体协作递归推理流式视频生成 3D一致性自主研究

Tstars-Tryon 1.0 深度解析封面：淘宝虚拟试穿、多图扩散、8 品类工业部署

2026-04-30 W17 深度专题论文解析

Tstars-Tryon 1.0 深度解析：淘宝虚拟试穿如何走到工业级（mmDiT、6 图、8 品类）

阿里淘宝/天猫 W17 最高票论文（248↑）：多图扩散（mmDiT）、最多 6 张参考图、8 个时尚品类、千万请求工业部署。技术架构、与 OOTDiffusion / IDM-VTON / CatVTON 横向对比，以及开发者上手与复现路径。

Tstars-Tryon 淘宝虚拟试穿 VTON 多图扩散 mmDiT 阿里巴巴

2026-04-25 W17 深度专题模型解析

DeepSeek V4 深度解析：DSA 稀疏注意力、1M 上下文、与 GPT-5/Claude/Gemini 全面对比

2026-04-24 发布的 V4-Pro/Flash：1.6T MoE、49B 激活、$3.48/M 输出。逐项拆解 DSA 稀疏注意力机制、LiveCodeBench 93.5/SWE-bench 80.6/Codeforces 3206 等 benchmark、价格策略、Huawei 昇腾绑定与开发者选型建议。

DeepSeek V4 DSA 稀疏注意力 1M 上下文 MoE 开源大模型华为昇腾

2026-04-25 W17 周报 8 篇精选

Tstars-Tryon 1.0 / LLaDA2.0-Uni / OneVL — 2026 W17 AI 论文周报（8 篇精选）

Tstars-Tryon 1.0 淘宝级虚拟试穿、LLaDA2.0-Uni 扩散统一多模态、OneVL 隐式推理超越 CoT、CoInteract 物理一致 HOI 视频、Agent-World 自进化训练、OpenGame 端到端游戏 Agent、NPO 近未来策略 RL、MultiWorld 多智能体世界模型 —— 多模态生成进入工业部署、隐式推理挑战 CoT 三大趋势。

多模态生成虚拟试穿扩散LLM 隐式推理 Agent训练世界模型

2026-04-19 W16 周报 8 篇精选

Seedance 2.0 / HY-World 2.0 / KnowRL — 2026 W16 AI 论文周报（8 篇精选）

Seedance 2.0 多模态音视频统一生成、HY-World 2.0 3DGS 世界模型、MEDS 记忆增强奖励塑造、RationalRewards 推理式奖励、KnowRL 最小充分知识点引导、OPD 蒸馏机制、OccuBench 100 行业 Agent 评测、AiScientist 长时程 ML —— 视频生成可探索世界、奖励设计成推理杠杆三大趋势。

视频生成 3D世界模型强化学习奖励建模 Agent评测长时程Agent

2026-04-12 W15 周报 8 篇精选

SpatialEdit / SkillClaw / ClawBench — 2026 W15 AI 论文周报（8 篇精选）

SpatialEdit 888 票登顶空间编辑基准、SkillClaw 技能集体演化、ClawBench 真实网站 Agent 评测、HY-Embodied 腾讯具身基础模型、OpenWorldLib 世界模型统一、TriAttention KV 压缩 —— Agent 评测体系成型、视觉生成过程可控三大趋势。

Agent评测视觉生成具身智能世界模型 KV缓存压缩

2026-04-04 W14 周报 7 篇精选

SKILL0 / CARLA-Air / GEMS — 2026 W14 AI 论文周报（7 篇精选）

SKILL0 通过 RL 内化 Agent 技能、CARLA-Air 统一空地仿真平台（302↑）、GEMS 记忆+技能增强 Agent、Terminal Agents 挑战 MCP 范式、Generative World Renderer 3A 游戏数据集、Medical AI Scientist 临床自主研究 —— Agent 技能内化、仿真世界基础设施化三大趋势。

Agent技能内化仿真平台世界模型 AI Scientist 潜在空间