Qwen 是什么?

这是阿里云通义千问(Qwen)大语言模型的官方初代仓库,开源了 Qwen 基础模型与 Qwen-Chat 对话模型(1.8B/7B/14B/72B 及其 Int4/Int8 量化版),并附技术报告。基础模型在多达约 3 万亿 token 的多语言数据(侧重中英)上预训练,对话模型经 SFT 等对齐,能聊天、创作、抽取、摘要、翻译、写代码、解数学题,并支持工具调用、作为 agent 或代码解释器。许可为 Apache-2.0,Python,约 21,179 stars。需明确:该仓库已不再积极维护——官方在 README 顶部指引关注后续的 QwenLM/Qwen2(及更新版本),本仓库为初代、与新代码库差异较大。

⭐ 20,924 Stars 🍴 1,773 Forks Python Apache-2.0 作者: QwenLM
来源:README.md(顶部 Qwen2 提示、模型表、Introduction、License);GitHub 仓库元数据(stars=21179、license=Apache-2.0、language=Python) 查看 GitHub 仓库 →

为什么值得关注

Qwen 是中文社区最重要的开源大模型系列之一,对开源 LLM 生态影响深远;这个初代仓库承载了 Qwen 第一代的模型、技术报告与完整的推理/量化/微调/部署教程,被广泛参考与二次开发,长期积累了高关注。截至数据采集约 21,179 stars。需提示:它现已被 Qwen2 及更新版本取代,关注最新能力应转向后续仓库与模型。

来源:README.md(Introduction、顶部 Qwen2 提示);GitHub 仓库元数据(stars=21179)

核心功能

多尺寸基础与对话模型

开源 Qwen-1.8B/7B/14B/72B 基础模型与对应 Chat 模型,并提供 Int4/Int8 量化版,覆盖从端侧到大模型多档位。

来源:README.md(模型表、Introduction)
工具调用与 Agent 能力

对话模型支持工具使用、作为 agent 或代码解释器,能完成创作、抽取、摘要、翻译、写代码、解数学等任务。

来源:README.md(Introduction、In this repo)
完整工程支持

提供量化(GPTQ/KV cache)、微调(全参/LoRA/Q-LoRA)、部署(vLLM/FastChat)、WebUI/CLI demo 与 OpenAI 风格 API 等全套教程。

来源:README.md(In this repo 列表)
多硬件与长上下文

支持 32K 上下文与长上下文理解评测,并适配 Ascend 910、Hygon DCU 等国产硬件,配套 qwen.cpp 与 Qwen-Agent。

来源:README.md(模型表、News 的 Ascend/DCU、In this repo)

技术架构

本仓库围绕初代 Qwen 模型提供完整工程支持:基础模型(Qwen-1.8B/7B/14B/72B,预训练 token 2.2T–3.0T,上下文 8K–32K)与对话模型(Qwen-*-Chat),以及 GPTQ Int4/Int8 与 KV cache 量化版本。文档覆盖:快速上手推理、量化模型细节、推理速度/显存统计、微调(全参/LoRA/Q-LoRA)、用 vLLM 与 FastChat 部署、构建 WebUI/CLI demo、DashScope API 与构建 OpenAI 风格 API、以及工具调用/agent/代码解释器用法和长上下文评测。还支持 Ascend 910、Hygon DCU 等国产硬件,并有配套的 qwen.cpp 与 Qwen-Agent。注意这些都对应初代,后续迭代在 Qwen2+ 仓库。

来源:README.md(模型表、In this repo 列表、News 段落)

项目知识图谱

知识图谱:项目核心节点(中心)+ 核心功能(内环六边形)+ 关键技术依赖(外环 chip) PyTorch、flash-attentionPyTorch、flash… Hugging Face / ModelScope(模型分发)Hugging Face /… qwen.cpp、Qwen-Agent(配套)qwen.cpp、Qwen… 多尺寸基础与对话模型 工具调用与 Agent 能力 完整工程支持 多硬件与长上下文 Qwen 项目本体 核心功能 关键依赖

中心为项目本体,内环 = 核心功能模块,外环 = 关键技术依赖;按 deep.json 中的 core_features 与 tech_stack.key_deps 自动生成

技术栈

语言Python框架Transformers 生态 + 量化(GPTQ)/部署(vLLM、FastChat)
PyTorch、flash-attentionHugging Face / ModelScope(模型分发)qwen.cpp、Qwen-Agent(配套)
支持 NVIDIA GPU 及 Ascend 910 / Hygon DCU;DashScope API
来源:README.md(In this repo、News、模型表);GitHub 仓库 topics(flash-attention)

快速上手

从 Hugging Face 或 ModelScope 下载相应规模的 Qwen / Qwen-Chat 模型(含 Int4/Int8 量化版),按仓库的 Quickstart 做推理;需要时按教程做量化、微调(全参/LoRA/Q-LoRA)或用 vLLM/FastChat 部署、构建 WebUI/CLI demo 或 OpenAI 风格 API。但请注意:本仓库为初代且不再积极维护——若要用 Qwen 的最新能力,应转向 QwenLM/Qwen2 及更新版本的仓库与模型。
来源:README.md(In this repo、顶部 Qwen2 提示、模型表)

使用场景

作为初代 Qwen 的工程参考仍有价值:学习如何对一个开源中文/双语大模型做推理、量化、微调与部署;在受限硬件(含国产 Ascend/DCU)上跑 LLM;或研究其技术报告与长上下文/工具调用设计。但用于实际生产或追求最新性能,应使用 Qwen2 及之后的版本——本仓库主要适合回顾与学习,而非作为当前首选模型。

来源:README.md(Introduction、In this repo、顶部 Qwen2 提示)

优势与局限

优势

  • 中文/双语开源大模型的奠基性系列之一,影响深远
  • 多尺寸 + 量化版本齐全,工程教程(量化/微调/部署/API)完整
  • 支持工具调用/agent/代码解释器与长上下文,适配国产硬件
  • 有技术报告,Apache-2.0 开源,参考价值高

局限

  • 本仓库为初代且已不再积极维护,应转向 Qwen2+ 获取最新能力
  • 模型与基准较早,性能已被后续版本超越
  • 大模型推理/微调对显存要求较高
  • 面向研究/工程,非现成产品
来源:README.md(顶部 Qwen2 提示、模型表、Introduction)

最新版本

本仓库(初代 Qwen)已停止积极维护。其历史里程碑包括 2023.11.30 发布 Qwen-72B/72B-Chat 与 Qwen-1.8B(3T token、32K 上下文、并支持 Ascend 910/Hygon DCU),以及此前 Int4/Int8 量化模型与 Qwen-14B、微调支持等。后续迭代在 QwenLM/Qwen2 及更新版本进行。

来源:README.md(News and Updates 段落、顶部 Qwen2 提示)

总结评价

这是通义千问(Qwen)的初代官方仓库,作为中文/双语开源大模型的奠基性系列之一影响深远,并提供了从推理、量化到微调、部署的完整工程教程与多尺寸模型,工程与学习价值很高。但要明确:它已不再积极维护,模型与基准偏早、已被后续版本超越——若要用 Qwen 的最新能力,应转向 QwenLM/Qwen2 及更新版本。把本仓库当作初代 Qwen 的工程与技术参考来看待是恰当的,实际使用请选最新版。

来源:综合 README.md 的初代定位、工程支持与不再维护的明确提示
透明度声明
本页内容由 AI(大语言模型)基于以下公开材料自动生成:GitHub README、代码目录结构、依赖文件、Release 信息。 分析时间: 2026-05-24 13:45. 质量评分: 100/100.

数据来源:README、GitHub API、依赖文件