Fengshenbang-LM(封神榜大模型)是 IDEA 研究院认知计算与自然语言研究中心(CCNL)主导的中文大模型开源体系,目标是成为中文 AIGC 与认知智能的基础设施。它包含一系列开源模型与研究成果:姜子牙(Ziya)通用大模型、二郎神(Erlangshen)等预训练语言模型、首个中文 Stable Diffusion、BioBART(生物医疗)、UniMC/UniEX 等,以及配套的「封神框架」用于预训练与微调。许可为 Apache-2.0,Python,约 4,136 stars。需提示:仓库近年更新趋缓(最近一次推送约在 2024 年中),更多体现为历史性的中文模型与研究合集。
来源:README.md(封神榜科技成果、大事件、首段描述);GitHub 仓库元数据(stars=4136、license=Apache-2.0、language=Python、pushed_at 2024-08) 查看 GitHub 仓库 →封神榜是中文开源大模型早期的代表性体系之一,对中文 NLP/AIGC 影响较大——曾以小模型刷新零样本学习 SOTA、开源首个中文 Stable Diffusion、推出姜子牙通用模型系列等,沉淀了大量模型与论文。它作为中文认知智能的基础设施被持续引用,因而出现在热榜。截至数据采集约 4,136 stars。需提示其近年更新放缓,使用最新中文模型可关注更新的项目。
来源:README.md(封神榜大事件的 SOTA/中文 SD/姜子牙等);GitHub 仓库元数据(stars=4136、pushed_at 2024-08)姜子牙(Ziya)通用大模型(含多模态)、二郎神(Erlangshen)等预训练语言模型,覆盖中文 NLU/NLG,曾刷新零样本/少样本榜单。
来源:README.md(封神榜大事件的姜子牙/二郎神/SOTA)开源首个中文 Stable Diffusion,开启中文 AI 艺术;并有多模态与生物医疗(BioBART)等领域模型。
来源:README.md(大事件的中文 SD、科技成果的 BioBART/FMIT)UniMC(零样本统一模型)、UniEX(统一抽取理解)等,面向 NLU 任务统一建模(多篇顶会论文)。
来源:README.md(科技成果 UniMC/UniEX)配套开源框架(PyTorch/Transformers,支持分布式训练)帮助轻松预训练与微调封神榜各模型,并有 GTS 生产平台。
来源:README.md(大事件的封神框架开源、GTS);topics(distributed-training)封神榜是一个中文大模型「开源体系」而非单一模型,按系列组织多类模型:通用大模型姜子牙(Ziya,含多模态版)、预训练语言模型二郎神(Erlangshen)等(覆盖 NLU/NLG)、首个中文 Stable Diffusion(AIGC 图像)、生物医疗的 BioBART、统一任务模型 UniMC/UniEX、以及多篇 ACL/EMNLP/COLING 论文成果。配套「封神框架」(基于 PyTorch/Transformers,支持分布式训练)帮助预训练与微调这些模型,并有 GTS 模型生产平台等。模型与代码以 Apache-2.0 开源,可在 HuggingFace 等获取。
来源:README.md(封神榜科技成果、大事件、topics 含 distributed-training/pretrained-models/multimodal)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
PyTorch、HuggingFace TransformersStable Diffusion(中文版)作为中文大模型/NLP 的研究与工程参考很有价值:使用或微调姜子牙、二郎神等中文模型做理解/生成任务、用中文 Stable Diffusion 做图像生成、参考 UniMC/UniEX 等统一任务建模思路、或用封神框架做中文模型的预训练/微调实验。它适合中文 NLP 研究、教学与历史脉络梳理;用于追求最新性能的生产,建议结合更新更活跃的模型/项目评估。
来源:README.md(科技成果、大事件、封神框架)本页未列出严格版本号;仓库近年更新趋缓(最近推送约在 2024 年中)。历史里程碑包括姜子牙通用/多模态模型、二郎神登顶 FewCLUE/ZeroCLUE、首个中文 Stable Diffusion 开源、封神框架开源与多篇顶会论文。它更多作为中文大模型早期体系的历史与研究合集。
来源:README.md(封神榜大事件时间线);GitHub pushed_atFengshenbang-LM(封神榜)是中文开源大模型的早期代表性体系:姜子牙、二郎神等模型、首个中文 Stable Diffusion、UniMC/UniEX 等统一任务模型,加配套封神框架与多篇顶会论文,对中文 NLP/AIGC 影响较大、研究与教学参考价值高。要明确它近年更新放缓、性能已被更新的模型超越,且面向研究而非开箱产品。把它当作中文大模型早期成果与研究脉络的重要参考很合适;追求最新中文能力则应结合更活跃的项目评估。
来源:综合 README.md 的成果体系与更新放缓的现状