Fengshenbang-LM 是什么?

Fengshenbang-LM(封神榜大模型)是 IDEA 研究院认知计算与自然语言研究中心(CCNL)主导的中文大模型开源体系,目标是成为中文 AIGC 与认知智能的基础设施。它包含一系列开源模型与研究成果:姜子牙(Ziya)通用大模型、二郎神(Erlangshen)等预训练语言模型、首个中文 Stable Diffusion、BioBART(生物医疗)、UniMC/UniEX 等,以及配套的「封神框架」用于预训练与微调。许可为 Apache-2.0,Python,约 4,136 stars。需提示:仓库近年更新趋缓(最近一次推送约在 2024 年中),更多体现为历史性的中文模型与研究合集。

⭐ 4,148 Stars 🍴 381 Forks Python Apache-2.0 作者: IDEA-CCNL
来源:README.md(封神榜科技成果、大事件、首段描述);GitHub 仓库元数据(stars=4136、license=Apache-2.0、language=Python、pushed_at 2024-08) 查看 GitHub 仓库 →

为什么值得关注

封神榜是中文开源大模型早期的代表性体系之一,对中文 NLP/AIGC 影响较大——曾以小模型刷新零样本学习 SOTA、开源首个中文 Stable Diffusion、推出姜子牙通用模型系列等,沉淀了大量模型与论文。它作为中文认知智能的基础设施被持续引用,因而出现在热榜。截至数据采集约 4,136 stars。需提示其近年更新放缓,使用最新中文模型可关注更新的项目。

来源:README.md(封神榜大事件的 SOTA/中文 SD/姜子牙等);GitHub 仓库元数据(stars=4136、pushed_at 2024-08)

核心功能

中文通用与预训练模型系列

姜子牙(Ziya)通用大模型(含多模态)、二郎神(Erlangshen)等预训练语言模型,覆盖中文 NLU/NLG,曾刷新零样本/少样本榜单。

来源:README.md(封神榜大事件的姜子牙/二郎神/SOTA)
中文 AIGC 与多模态

开源首个中文 Stable Diffusion,开启中文 AI 艺术;并有多模态与生物医疗(BioBART)等领域模型。

来源:README.md(大事件的中文 SD、科技成果的 BioBART/FMIT)
统一任务模型

UniMC(零样本统一模型)、UniEX(统一抽取理解)等,面向 NLU 任务统一建模(多篇顶会论文)。

来源:README.md(科技成果 UniMC/UniEX)
封神框架(预训练/微调)

配套开源框架(PyTorch/Transformers,支持分布式训练)帮助轻松预训练与微调封神榜各模型,并有 GTS 生产平台。

来源:README.md(大事件的封神框架开源、GTS);topics(distributed-training)

技术架构

封神榜是一个中文大模型「开源体系」而非单一模型,按系列组织多类模型:通用大模型姜子牙(Ziya,含多模态版)、预训练语言模型二郎神(Erlangshen)等(覆盖 NLU/NLG)、首个中文 Stable Diffusion(AIGC 图像)、生物医疗的 BioBART、统一任务模型 UniMC/UniEX、以及多篇 ACL/EMNLP/COLING 论文成果。配套「封神框架」(基于 PyTorch/Transformers,支持分布式训练)帮助预训练与微调这些模型,并有 GTS 模型生产平台等。模型与代码以 Apache-2.0 开源,可在 HuggingFace 等获取。

来源:README.md(封神榜科技成果、大事件、topics 含 distributed-training/pretrained-models/multimodal)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) PyTorch、HuggingFace TransformersPyTorch、Huggi… Stable Diffusion(中文版)Stable Diffusi… 中文通用与预训练模型系列中文通用与预训练模型系… 中文 AIGC 与多模态 统一任务模型 封神框架(预训练/微调) Fengshenbang-LM 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python框架封神框架(PyTorch + Transformers,分布式训练)
PyTorch、HuggingFace TransformersStable Diffusion(中文版)
开源模型在 HuggingFace 等;支持分布式预训练/微调;GTS 模型生产平台
来源:README.md(封神框架、topics);GitHub 仓库元数据(language=Python)

快速上手

封神榜的模型多发布在 HuggingFace 等平台,可直接下载相应系列(姜子牙、二郎神、中文 Stable Diffusion 等)做推理;需要预训练/微调则用配套的「封神框架」(基于 PyTorch/Transformers,支持分布式)。各模型的具体用法、论文与下载链接见 README 的「封神榜科技成果」与「大事件」中的链接。注意仓库近年更新放缓,若需最新中文大模型能力,建议同时关注更新更活跃的项目。
来源:README.md(封神框架、科技成果链接、大事件);GitHub pushed_at

使用场景

作为中文大模型/NLP 的研究与工程参考很有价值:使用或微调姜子牙、二郎神等中文模型做理解/生成任务、用中文 Stable Diffusion 做图像生成、参考 UniMC/UniEX 等统一任务建模思路、或用封神框架做中文模型的预训练/微调实验。它适合中文 NLP 研究、教学与历史脉络梳理;用于追求最新性能的生产,建议结合更新更活跃的模型/项目评估。

来源:README.md(科技成果、大事件、封神框架)

优势与局限

优势

  • 中文开源大模型的早期代表体系,模型与论文沉淀丰富
  • 覆盖通用/预训练/多模态/AIGC(首个中文 SD)/领域模型
  • 配套封神框架支持预训练与微调,Apache-2.0 开源
  • 对中文 NLP/AIGC 影响较大,研究/教学参考价值高

局限

  • 仓库近年更新放缓(最近推送约 2024 年中),性能已被新模型超越
  • 面向研究/工程,非开箱产品
  • 大模型训练/微调对算力有要求
  • 追求最新中文能力应关注更新更活跃的项目
来源:README.md(大事件、科技成果);GitHub 仓库元数据(pushed_at 2024-08)

最新版本

本页未列出严格版本号;仓库近年更新趋缓(最近推送约在 2024 年中)。历史里程碑包括姜子牙通用/多模态模型、二郎神登顶 FewCLUE/ZeroCLUE、首个中文 Stable Diffusion 开源、封神框架开源与多篇顶会论文。它更多作为中文大模型早期体系的历史与研究合集。

来源:README.md(封神榜大事件时间线);GitHub pushed_at

总结评价

Fengshenbang-LM(封神榜)是中文开源大模型的早期代表性体系:姜子牙、二郎神等模型、首个中文 Stable Diffusion、UniMC/UniEX 等统一任务模型,加配套封神框架与多篇顶会论文,对中文 NLP/AIGC 影响较大、研究与教学参考价值高。要明确它近年更新放缓、性能已被更新的模型超越,且面向研究而非开箱产品。把它当作中文大模型早期成果与研究脉络的重要参考很合适;追求最新中文能力则应结合更活跃的项目评估。

来源:综合 README.md 的成果体系与更新放缓的现状
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 15:06. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件