modelscope/ms-swift 是一个用于大规模模型和跨模态大模型微调和部署的开源框架,支持600+文本大模型和400+跨模态大模型。
来源:据 README 描述 查看 GitHub 仓库 →该项目因其支持多种大模型和模态、集成最新训练技术、提供全流程支持以及丰富的功能特性而受到关注。它填补了大规模模型微调和部署的空白,为开发者提供了强大的工具。
来源:综合 README 描述和项目特征支持600+文本大模型和400+跨模态大模型,包括Qwen3, Qwen3.5, InternLM3, GLM4.5, Mistral, DeepSeek-R1, Llama4等。
来源:据 README 描述集成Megatron并行技术,如TP, PP, CP, EP,以及多种GRPO算法家族的强化学习算法,如GRPO, DAPO, GSPO, SAPO, CISPO, RLOO, Reinforce++等。
来源:据 README 描述支持多种训练任务,包括偏好学习算法如DPO, KTO, RM, CPO, SimPO, ORPO,以及嵌入、重排器和序列分类任务。
来源:据 README 描述项目采用模块化设计,代码结构清晰,依赖文件明确。主要模块包括训练、推理、评估、量化、部署等,数据通过模块间接口进行流转。关键技术决策包括支持多种并行训练技术和跨模态训练。
来源:代码目录结构 + 依赖文件infra: 支持多种硬件和平台,包括A10/A100/H100, RTX系列, T4/V100, CPU, MPS, 以及国内硬件Ascend NPU等 | key_deps: modelscope, transformers, torch | language: Python | framework: PyTorch
来源:依赖文件 + 代码目录结构适用于需要微调和部署大规模模型和跨模态大模型的开发者,例如自然语言处理、计算机视觉、多模态学习等领域。
来源:READMEv4.1.0 (2026-04-07): 主要变更包括mcore-bridge从ms-swift拆分成独立repo,以及一些bug修复和性能优化。
来源:GitHub Releasesmodelscope/ms-swift 是一个功能强大的开源框架,对于需要微调和部署大规模模型和跨模态大模型的开发者来说,是一个值得关注和使用的项目。它适合需要处理复杂模型和任务的团队或个人使用。
来源:综合分析