这是阿里云通义千问(Qwen)大语言模型的官方初代仓库,开源了 Qwen 基础模型与 Qwen-Chat 对话模型(1.8B/7B/14B/72B 及其 Int4/Int8 量化版),并附技术报告。基础模型在多达约 3 万亿 token 的多语言数据(侧重中英)上预训练,对话模型经 SFT 等对齐,能聊天、创作、抽取、摘要、翻译、写代码、解数学题,并支持工具调用、作为 agent 或代码解释器。许可为 Apache-2.0,Python,约 21,179 stars。需明确:该仓库已不再积极维护——官方在 README 顶部指引关注后续的 QwenLM/Qwen2(及更新版本),本仓库为初代、与新代码库差异较大。
来源:README.md(顶部 Qwen2 提示、模型表、Introduction、License);GitHub 仓库元数据(stars=21179、license=Apache-2.0、language=Python) 查看 GitHub 仓库 →Qwen 是中文社区最重要的开源大模型系列之一,对开源 LLM 生态影响深远;这个初代仓库承载了 Qwen 第一代的模型、技术报告与完整的推理/量化/微调/部署教程,被广泛参考与二次开发,长期积累了高关注。截至数据采集约 21,179 stars。需提示:它现已被 Qwen2 及更新版本取代,关注最新能力应转向后续仓库与模型。
来源:README.md(Introduction、顶部 Qwen2 提示);GitHub 仓库元数据(stars=21179)开源 Qwen-1.8B/7B/14B/72B 基础模型与对应 Chat 模型,并提供 Int4/Int8 量化版,覆盖从端侧到大模型多档位。
来源:README.md(模型表、Introduction)对话模型支持工具使用、作为 agent 或代码解释器,能完成创作、抽取、摘要、翻译、写代码、解数学等任务。
来源:README.md(Introduction、In this repo)提供量化(GPTQ/KV cache)、微调(全参/LoRA/Q-LoRA)、部署(vLLM/FastChat)、WebUI/CLI demo 与 OpenAI 风格 API 等全套教程。
来源:README.md(In this repo 列表)支持 32K 上下文与长上下文理解评测,并适配 Ascend 910、Hygon DCU 等国产硬件,配套 qwen.cpp 与 Qwen-Agent。
来源:README.md(模型表、News 的 Ascend/DCU、In this repo)本仓库围绕初代 Qwen 模型提供完整工程支持:基础模型(Qwen-1.8B/7B/14B/72B,预训练 token 2.2T–3.0T,上下文 8K–32K)与对话模型(Qwen-*-Chat),以及 GPTQ Int4/Int8 与 KV cache 量化版本。文档覆盖:快速上手推理、量化模型细节、推理速度/显存统计、微调(全参/LoRA/Q-LoRA)、用 vLLM 与 FastChat 部署、构建 WebUI/CLI demo、DashScope API 与构建 OpenAI 风格 API、以及工具调用/agent/代码解释器用法和长上下文评测。还支持 Ascend 910、Hygon DCU 等国产硬件,并有配套的 qwen.cpp 与 Qwen-Agent。注意这些都对应初代,后续迭代在 Qwen2+ 仓库。
来源:README.md(模型表、In this repo 列表、News 段落)中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成
PyTorch、flash-attentionHugging Face / ModelScope(模型分发)qwen.cpp、Qwen-Agent(配套)作为初代 Qwen 的工程参考仍有价值:学习如何对一个开源中文/双语大模型做推理、量化、微调与部署;在受限硬件(含国产 Ascend/DCU)上跑 LLM;或研究其技术报告与长上下文/工具调用设计。但用于实际生产或追求最新性能,应使用 Qwen2 及之后的版本——本仓库主要适合回顾与学习,而非作为当前首选模型。
来源:README.md(Introduction、In this repo、顶部 Qwen2 提示)本仓库(初代 Qwen)已停止积极维护。其历史里程碑包括 2023.11.30 发布 Qwen-72B/72B-Chat 与 Qwen-1.8B(3T token、32K 上下文、并支持 Ascend 910/Hygon DCU),以及此前 Int4/Int8 量化模型与 Qwen-14B、微调支持等。后续迭代在 QwenLM/Qwen2 及更新版本进行。
来源:README.md(News and Updates 段落、顶部 Qwen2 提示)这是通义千问(Qwen)的初代官方仓库,作为中文/双语开源大模型的奠基性系列之一影响深远,并提供了从推理、量化到微调、部署的完整工程教程与多尺寸模型,工程与学习价值很高。但要明确:它已不再积极维护,模型与基准偏早、已被后续版本超越——若要用 Qwen 的最新能力,应转向 QwenLM/Qwen2 及更新版本。把本仓库当作初代 Qwen 的工程与技术参考来看待是恰当的,实际使用请选最新版。
来源:综合 README.md 的初代定位、工程支持与不再维护的明确提示