模型教程
AI 入门:DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 最新模型速览
只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型,并按厂家单独列出官网、上下文、模型规模、是否开源、API 价格、网页端订阅与 Token Plan 信息。
2026-04-2812 分钟教程 / AI入门
更新时间:2026-04-28。本文只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型。这里把“Token Plan / 订阅套餐 / Coding Plan”分开写:有些厂商自家就叫 Token Plan,有些是网页端会员或云平台聚合套餐,不能混成一类。
先看结论
如果你是 AI 入门用户,可以先按这个思路理解:
- 想看极长上下文和低价 API:先看 DeepSeek V4。
- 想要阿里云生态、国内企业接入和百炼 Token Plan:先看 Qwen / 百炼。
- 想做长文档、多模态 Agent、Kimi Code 和个人网页端会员:先看 Kimi K2.6。
- 想做长程 Coding Agent、Claude Code / Cline / OpenCode 替代:先看 GLM-5.1 和 GLM Coding Plan。
- 想要国内开放平台 Token Plan、工程 Agent 与多模态额度:先看 MiniMax M2.7。
说明:下表里的“是否有 Token Plan”优先指厂商自家官网或国内开放平台明确命名为 Token Plan 的套餐。阿里云百炼等云平台的聚合型 Token Plan 会单独标注,避免误以为是模型厂商自家套餐。
DeepSeek(国内官网:https://www.deepseek.com/zh)
| 项目 | 信息 |
|---|---|
| 厂家 / 品牌 | 深度求索 DeepSeek |
| 国内官网主页 | https://www.deepseek.com/zh;API 文档:https://api-docs.deepseek.com/zh-cn |
| 最新重点模型 | deepseek-v4-flash、deepseek-v4-pro |
| 上下文参数 | 官方 API 价格页显示上下文长度 1M,最大输出 384K |
| 模型规模 | 官方 API 价格页未在价格表披露参数规模;开放权重或模型卡信息请以 DeepSeek 官方发布页为准 |
| 是否开源 | DeepSeek 长期提供部分开放权重模型;具体到 V4 系列请以官方模型页和许可证为准 |
| 主要能力 | 思考 / 非思考模式、长上下文、工具调用、JSON Output、Anthropic API 兼容、FIM 补全等 |
| 是否有 Token Plan | 自家官方暂未看到名为 Token Plan / Coding Plan 的订阅套餐 |
| Token Plan 相关信息 | DeepSeek 官方 API 是按 tokens 计费,从充值余额或赠送余额扣减;阿里云百炼 Token Plan 团队版支持 deepseek-v3.2,但这是百炼聚合套餐,不等同于 DeepSeek 官方自家 Token Plan |
| API 价格参考 | deepseek-v4-flash:缓存命中输入 0.02 元/百万 tokens,缓存未命中输入 1 元/百万 tokens,输出 2 元/百万 tokens;deepseek-v4-pro:官方当前价格页显示缓存命中输入 0.025 元/百万 tokens、缓存未命中输入 3 元/百万 tokens、输出 6 元/百万 tokens,优惠期以官方页面为准 |
| 入门建议 | 想低成本做 API 试验、长上下文阅读和工程任务评估,可以先用 flash 做基线,再用 pro 处理高难任务 |
Qwen / 通义千问(国内官网:https://qwen.ai)
| 项目 | 信息 |
|---|---|
| 厂家 / 品牌 | 阿里云 / 通义千问 Qwen / Model Studio 百炼 |
| 国内官网主页 | https://qwen.ai;百炼控制台与文档:https://bailian.console.aliyun.com、https://help.aliyun.com/zh/model-studio |
| 最新重点模型 | qwen3.6-max-preview、qwen3.6-plus、qwen3.6-flash;开源侧可关注 Qwen3 / Qwen3.6 系列 |
| 上下文参数 | 百炼文档显示 qwen3.6-plus 与 qwen3.6-flash 支持 1M 上下文,qwen3.6-max-preview 支持 256K;最大输出 64K |
| 模型规模 | 商业 API 模型未统一公开总参数;开源模型按具体权重区分,如 Qwen3 系列 0.6B、1.7B、4B、8B、14B、32B、30B-A3B、235B-A22B 等 |
| 是否开源 | Qwen 有大量开源权重;商业 API 的 Max / Plus / Flash 不等同全部开源 |
| 主要能力 | 长上下文、思考模式、Function Calling、内置工具、结构化输出、企业云上接入、批量调用 |
| 是否有 Token Plan | 有,但主要在阿里云百炼 Token Plan 团队版体系里使用;百炼文本模型页显示 qwen3.6-plus 支持 Token Plan,qwen3.6-max-preview 与 qwen3.6-flash 当前不支持 Token Plan |
| Token Plan 具体信息 | 百炼 Token Plan 团队版以 Credits 统一计量,支持文本生成与图像生成模型;支持模型示例包括 qwen3.6-plus、glm-5、MiniMax-M2.5、deepseek-v3.2;目前文档说明仅支持华北 2(北京)地域 |
| Token Plan 套餐 | 标准坐席 198 元/席/月,25,000 Credits;高级坐席 698 元/席/月,100,000 Credits;尊享坐席 1,398 元/席/月,250,000 Credits;共享用量包 5,000 元/个,625,000 Credits |
| API 价格参考 | 百炼价格变化快,Qwen3.6-Max-Preview、Plus、Flash 的输入/输出价格请以百炼文本模型价格页为准;同一模型在不同地域、快照、促销期可能不同 |
| 入门建议 | 公司已经在阿里云、需要权限、账单、合规和多模型统一管理时,优先测试百炼;只做模型能力评估时,可以先用 qwen3.6-plus 做 Token Plan / Coding Plan 兼容性验证 |
Kimi(月之暗面)(国内官网:https://www.kimi.com)
| 项目 | 信息 |
|---|---|
| 厂家 / 品牌 | 月之暗面 Moonshot AI / Kimi |
| 国内官网主页 | https://www.kimi.com;开放平台:https://platform.kimi.com;Kimi Code:https://www.kimi.com/code/zh |
| 最新重点模型 | Kimi K2.6 |
| 上下文参数 | Kimi K2.6 API 与模型资料常见标注为 256K / 262,144 tokens |
| 模型规模 | Kimi K2.6 模型资料显示约 1T 总参数 / 32B 激活,MoonViT 视觉编码器约 400M 参数 |
| 是否开源 | Kimi K2.6 有开放权重版本;许可证和商用条款需看官方模型页 |
| 主要能力 | 长程 Coding、视觉理解、视频输入、Agent Swarm、Kimi Code、Kimi Claw、工具调用、思考 / 非思考模式 |
| 是否有 Token Plan | Kimi 自家网页端没有把会员套餐命名为 Token Plan;它采用 Kimi 会员统一额度池,按 token 消耗,会员功能共享额度 |
| 网页端会员与额度 | Kimi 会员包含 Adagio 免费、Andante 49 元/月、Moderato 99 元/月、Allegretto 199 元/月、Allegro 699 元/月;官方帮助中心说明所有套餐采用统一额度池,额度可跨对话、Agent、PPT、深度研究、Kimi Code、Kimi Claw 等功能共享 |
| Kimi Code 订阅关系 | Kimi Code 是 Kimi 会员计划中面向代码开发的权益,Andante 起可使用;额度作为会员权益之一,通常无需为 Kimi Code 单独额外付费,但会消耗对应套餐额度 |
| API 价格参考 | Kimi K2.6 API 按 tokens 计费;常见价格口径为缓存命中输入、缓存未命中输入与输出分档,具体人民币 / 美元价格以 Kimi 开放平台价格页为准 |
| 入门建议 | 个人网页端重度使用文档、PPT、Agent、代码任务时看会员;企业系统集成仍应走 Kimi 开放平台 API,并单独核算 token 成本 |
智谱 GLM / Z.AI(国内官网:https://www.bigmodel.cn)
| 项目 | 信息 |
|---|---|
| 厂家 / 品牌 | 智谱 AI / Z.AI / GLM |
| 国内官网主页 | https://www.bigmodel.cn;开发文档:https://docs.z.ai |
| 最新重点模型 | GLM-5.1 |
| 上下文参数 | GLM-5.1 官方资料常见标注约 200K tokens;百炼三方模型 glm-5 文档显示约 198K |
| 模型规模 | GLM-5.1 模型页显示约 754B 参数 |
| 是否开源 | GLM-5.1 有开放权重版本,模型页标注 MIT License;企业商用仍建议核对模型卡与官方条款 |
| 主要能力 | 长程 Coding Agent、工具调用、结构化输出、上下文缓存、MCP、Claude Code / Cline / OpenCode 类开发工作流 |
| 是否有 Token Plan | 自家官方目前主推 GLM Coding Plan,不叫 Token Plan;阿里云百炼 Token Plan 团队版支持 glm-5,但这是百炼聚合套餐 |
| Coding Plan 具体信息 | GLM Coding Plan 面向 AI 编程工具,官方文档写明支持 Claude Code、Cline、OpenCode 等;所有套餐支持 GLM-5.1、GLM-5-Turbo、GLM-4.7、GLM-4.5-Air |
| Coding Plan 套餐额度 | 起价 18 美元/月;Lite 约 80 prompts / 5 小时、400 prompts / 周;Pro 约 400 prompts / 5 小时、2,000 prompts / 周;Max 约 1,600 prompts / 5 小时、8,000 prompts / 周;GLM-5.1 高峰期按更高倍率扣除额度,具体以官方文档为准 |
| API 价格参考 | Z.AI 文档显示 GLM-5.1 按 tokens 计费;价格与促销可能变化,请以 Pricing 页面为准 |
| 入门建议 | 如果目标是替代或补充 Claude Code 类编程工作流,先测 GLM-5.1 + Coding Plan;如果是后端 API 集成,按 API 价格单独评估 |
MiniMax(国内官网:https://www.minimaxi.com)
| 项目 | 信息 |
|---|---|
| 厂家 / 品牌 | MiniMax |
| 国内官网主页 | 国内官网:https://www.minimaxi.com;国内开放平台:https://platform.minimaxi.com;Token Plan:https://platform.minimaxi.com/subscribe/token-plan |
| 最新重点模型 | MiniMax-M2.7、MiniMax-M2.7-highspeed |
| 上下文参数 | MiniMax-M2.7 系列常见标注约 204,800 tokens |
| 模型规模 | MiniMax-M2.7 模型页显示约 229B 参数 |
| 是否开源 | 开放权重可下载;许可证显示不是简单 MIT / Apache,商用和二次分发必须看官方 LICENSE |
| 主要能力 | 软件工程、代码安全、办公文档、Agent Teams、多工具协同、长程任务、文本 / 语音 / 图像 / 视频 / 音乐多模态生态 |
| 是否有 Token Plan | 有。MiniMax 国内开放平台明确提供 Token Plan,官方文档说明这是此前 Coding Plan 的全面升级 |
| Token Plan 计量规则 | M2.7 / M2.7-highspeed 按请求数计算,每 5 小时滚动重置;语音、图像、视频、音乐等非文本模型按每日配额计算;Token Plan API Key 与按量计费 API Key 不可互换 |
| 标准版套餐 | Starter:290 元/年,M2.7 600 次请求 / 5 小时;Plus:490 元/年,1,500 次请求 / 5 小时;Max:1,190 元/年,4,500 次请求 / 5 小时;每周可用额度约为 5 小时额度的 10 倍 |
| 极速版套餐 | Plus-极速版:980 元/年,M2.7-highspeed 1,500 次请求 / 5 小时;Max-极速版:1,990 元/年,4,500 次请求 / 5 小时;Ultra-极速版:8,990 元/年,30,000 次请求 / 5 小时;极速版约 100 TPS,普通版约 50 TPS,具体以页面说明为准 |
| API 按量价格参考 | 国内开放平台按量计费页显示 MiniMax-M2.7:输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens,缓存读取 0.42 元/百万 tokens,缓存写入 2.625 元/百万 tokens;M2.7-highspeed:输入 4.2 元/百万 tokens,输出 16.8 元/百万 tokens,缓存读取 0.42 元/百万 tokens,缓存写入 2.625 元/百万 tokens |
| 入门建议 | 如果你需要“固定订阅费 + 编程 Agent + 多模态额度”,MiniMax Token Plan 是五家里最需要单独拿出来看的;不要再用国际站价格判断国内套餐 |
怎么选择
| 使用场景 | 优先看 |
|---|---|
| 免费网页体验、观察国产旗舰能力 | DeepSeek、Kimi、Qwen |
| 企业云上 API、国内合规和云资源整合 | Qwen / 阿里云百炼、智谱 GLM |
| 官方或平台明确 Token Plan | MiniMax 国内 Token Plan、阿里云百炼 Token Plan 团队版 |
| 网页端个人会员 / 统一额度池 | Kimi 会员 |
| AI 编程工具套餐 | GLM Coding Plan、MiniMax Token Plan、Kimi Code 会员权益、百炼 Coding Plan |
| 开源权重、本地部署或二次开发 | DeepSeek 开放权重、Qwen 开源系列、Kimi K2.6、GLM-5.1、MiniMax M2.7 |
| 成本优先 | DeepSeek V4-Flash、MiniMax-M2.7、Qwen3.6-Flash |
入门时最容易误解的几点
- “Token Plan”不是统一行业标准。有的是厂商自家套餐,有的是云平台聚合套餐,有的是网页端会员额度池。
- “有 Token Plan”不代表所有模型都支持。例如百炼文本模型页显示 qwen3.6-plus 支持,但 qwen3.6-max-preview 与 qwen3.6-flash 当前不支持。
- “开源”不等于“随便商用”。DeepSeek、Qwen、Kimi、GLM、MiniMax 的许可证并不完全相同,商用前要读模型页 LICENSE。
- “上下文很长”不等于“无限准确”。长上下文会带来成本、速度和检索质量问题,企业项目仍然需要 RAG、缓存和评测。
- “订阅套餐”适合交互式工具和个人 / 团队开发,企业后端自动化调用通常仍要回到 API 按量计费或企业合同。
参考来源
- DeepSeek 官方资料:DeepSeek 中文官网、DeepSeek API 模型与价格
- Qwen / 阿里云百炼官方资料:百炼文本生成模型、百炼 Token Plan 团队版概述
- Kimi 官方资料:Kimi 会员套餐价格与权益、Kimi Agent 额度与计费、Kimi Code
- 智谱 GLM 官方资料:GLM Coding Plan、Z.AI 文档
- MiniMax 国内官方资料:MiniMax 国内官网、MiniMax 国内开放平台、MiniMax Token Plan、Token Plan 概要、MiniMax 国内按量计费