DeepSeek-R1-Zero 和 DeepSeek-R1,通过强化学习和微调提升推理能力
来源:据 README 第 1 段将大型模型推理模式蒸馏到小型模型,提升性能
来源:据 README 第 2 段提供 DeepSeek-R1-Zero、DeepSeek-R1 和多个蒸馏模型的开源版本
来源:据 README 第 3 段包含 .github 工作流程、模型文档、许可证、README、图片目录等
来源:代码目录结构key_deps: 信息不足,待补充 | language: 未知 | framework: 未知
来源:信息不足,待补充数学、代码和推理任务
来源:据 README 第 1 段v1.0.0 (2025-06-27): 用于存档和 DOI 生成
来源:GitHub Releases