返回模型教程

模型教程

AI 入门:DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 最新模型速览

只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型,并按厂家单独列出官网、上下文、模型规模、是否开源、API 价格、网页端订阅与 Token Plan 信息。

2026-04-2812 分钟教程 / AI入门

更新时间:2026-04-28。本文只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型。这里把“Token Plan / 订阅套餐 / Coding Plan”分开写:有些厂商自家就叫 Token Plan,有些是网页端会员或云平台聚合套餐,不能混成一类。

先看结论

如果你是 AI 入门用户,可以先按这个思路理解:

  • 想看极长上下文和低价 API:先看 DeepSeek V4。
  • 想要阿里云生态、国内企业接入和百炼 Token Plan:先看 Qwen / 百炼。
  • 想做长文档、多模态 Agent、Kimi Code 和个人网页端会员:先看 Kimi K2.6。
  • 想做长程 Coding Agent、Claude Code / Cline / OpenCode 替代:先看 GLM-5.1 和 GLM Coding Plan。
  • 想要国内开放平台 Token Plan、工程 Agent 与多模态额度:先看 MiniMax M2.7。

说明:下表里的“是否有 Token Plan”优先指厂商自家官网或国内开放平台明确命名为 Token Plan 的套餐。阿里云百炼等云平台的聚合型 Token Plan 会单独标注,避免误以为是模型厂商自家套餐。

DeepSeek(国内官网:https://www.deepseek.com/zh

项目 信息
厂家 / 品牌 深度求索 DeepSeek
国内官网主页 https://www.deepseek.com/zh;API 文档:https://api-docs.deepseek.com/zh-cn
最新重点模型 deepseek-v4-flash、deepseek-v4-pro
上下文参数 官方 API 价格页显示上下文长度 1M,最大输出 384K
模型规模 官方 API 价格页未在价格表披露参数规模;开放权重或模型卡信息请以 DeepSeek 官方发布页为准
是否开源 DeepSeek 长期提供部分开放权重模型;具体到 V4 系列请以官方模型页和许可证为准
主要能力 思考 / 非思考模式、长上下文、工具调用、JSON Output、Anthropic API 兼容、FIM 补全等
是否有 Token Plan 自家官方暂未看到名为 Token Plan / Coding Plan 的订阅套餐
Token Plan 相关信息 DeepSeek 官方 API 是按 tokens 计费,从充值余额或赠送余额扣减;阿里云百炼 Token Plan 团队版支持 deepseek-v3.2,但这是百炼聚合套餐,不等同于 DeepSeek 官方自家 Token Plan
API 价格参考 deepseek-v4-flash:缓存命中输入 0.02 元/百万 tokens,缓存未命中输入 1 元/百万 tokens,输出 2 元/百万 tokens;deepseek-v4-pro:官方当前价格页显示缓存命中输入 0.025 元/百万 tokens、缓存未命中输入 3 元/百万 tokens、输出 6 元/百万 tokens,优惠期以官方页面为准
入门建议 想低成本做 API 试验、长上下文阅读和工程任务评估,可以先用 flash 做基线,再用 pro 处理高难任务

Qwen / 通义千问(国内官网:https://qwen.ai

项目 信息
厂家 / 品牌 阿里云 / 通义千问 Qwen / Model Studio 百炼
国内官网主页 https://qwen.ai;百炼控制台与文档:https://bailian.console.aliyun.comhttps://help.aliyun.com/zh/model-studio
最新重点模型 qwen3.6-max-preview、qwen3.6-plus、qwen3.6-flash;开源侧可关注 Qwen3 / Qwen3.6 系列
上下文参数 百炼文档显示 qwen3.6-plus 与 qwen3.6-flash 支持 1M 上下文,qwen3.6-max-preview 支持 256K;最大输出 64K
模型规模 商业 API 模型未统一公开总参数;开源模型按具体权重区分,如 Qwen3 系列 0.6B、1.7B、4B、8B、14B、32B、30B-A3B、235B-A22B 等
是否开源 Qwen 有大量开源权重;商业 API 的 Max / Plus / Flash 不等同全部开源
主要能力 长上下文、思考模式、Function Calling、内置工具、结构化输出、企业云上接入、批量调用
是否有 Token Plan 有,但主要在阿里云百炼 Token Plan 团队版体系里使用;百炼文本模型页显示 qwen3.6-plus 支持 Token Plan,qwen3.6-max-preview 与 qwen3.6-flash 当前不支持 Token Plan
Token Plan 具体信息 百炼 Token Plan 团队版以 Credits 统一计量,支持文本生成与图像生成模型;支持模型示例包括 qwen3.6-plus、glm-5、MiniMax-M2.5、deepseek-v3.2;目前文档说明仅支持华北 2(北京)地域
Token Plan 套餐 标准坐席 198 元/席/月,25,000 Credits;高级坐席 698 元/席/月,100,000 Credits;尊享坐席 1,398 元/席/月,250,000 Credits;共享用量包 5,000 元/个,625,000 Credits
API 价格参考 百炼价格变化快,Qwen3.6-Max-Preview、Plus、Flash 的输入/输出价格请以百炼文本模型价格页为准;同一模型在不同地域、快照、促销期可能不同
入门建议 公司已经在阿里云、需要权限、账单、合规和多模型统一管理时,优先测试百炼;只做模型能力评估时,可以先用 qwen3.6-plus 做 Token Plan / Coding Plan 兼容性验证

Kimi(月之暗面)(国内官网:https://www.kimi.com

项目 信息
厂家 / 品牌 月之暗面 Moonshot AI / Kimi
国内官网主页 https://www.kimi.com;开放平台:https://platform.kimi.com;Kimi Code:https://www.kimi.com/code/zh
最新重点模型 Kimi K2.6
上下文参数 Kimi K2.6 API 与模型资料常见标注为 256K / 262,144 tokens
模型规模 Kimi K2.6 模型资料显示约 1T 总参数 / 32B 激活,MoonViT 视觉编码器约 400M 参数
是否开源 Kimi K2.6 有开放权重版本;许可证和商用条款需看官方模型页
主要能力 长程 Coding、视觉理解、视频输入、Agent Swarm、Kimi Code、Kimi Claw、工具调用、思考 / 非思考模式
是否有 Token Plan Kimi 自家网页端没有把会员套餐命名为 Token Plan;它采用 Kimi 会员统一额度池,按 token 消耗,会员功能共享额度
网页端会员与额度 Kimi 会员包含 Adagio 免费、Andante 49 元/月、Moderato 99 元/月、Allegretto 199 元/月、Allegro 699 元/月;官方帮助中心说明所有套餐采用统一额度池,额度可跨对话、Agent、PPT、深度研究、Kimi Code、Kimi Claw 等功能共享
Kimi Code 订阅关系 Kimi Code 是 Kimi 会员计划中面向代码开发的权益,Andante 起可使用;额度作为会员权益之一,通常无需为 Kimi Code 单独额外付费,但会消耗对应套餐额度
API 价格参考 Kimi K2.6 API 按 tokens 计费;常见价格口径为缓存命中输入、缓存未命中输入与输出分档,具体人民币 / 美元价格以 Kimi 开放平台价格页为准
入门建议 个人网页端重度使用文档、PPT、Agent、代码任务时看会员;企业系统集成仍应走 Kimi 开放平台 API,并单独核算 token 成本

智谱 GLM / Z.AI(国内官网:https://www.bigmodel.cn

项目 信息
厂家 / 品牌 智谱 AI / Z.AI / GLM
国内官网主页 https://www.bigmodel.cn;开发文档:https://docs.z.ai
最新重点模型 GLM-5.1
上下文参数 GLM-5.1 官方资料常见标注约 200K tokens;百炼三方模型 glm-5 文档显示约 198K
模型规模 GLM-5.1 模型页显示约 754B 参数
是否开源 GLM-5.1 有开放权重版本,模型页标注 MIT License;企业商用仍建议核对模型卡与官方条款
主要能力 长程 Coding Agent、工具调用、结构化输出、上下文缓存、MCP、Claude Code / Cline / OpenCode 类开发工作流
是否有 Token Plan 自家官方目前主推 GLM Coding Plan,不叫 Token Plan;阿里云百炼 Token Plan 团队版支持 glm-5,但这是百炼聚合套餐
Coding Plan 具体信息 GLM Coding Plan 面向 AI 编程工具,官方文档写明支持 Claude Code、Cline、OpenCode 等;所有套餐支持 GLM-5.1、GLM-5-Turbo、GLM-4.7、GLM-4.5-Air
Coding Plan 套餐额度 起价 18 美元/月;Lite 约 80 prompts / 5 小时、400 prompts / 周;Pro 约 400 prompts / 5 小时、2,000 prompts / 周;Max 约 1,600 prompts / 5 小时、8,000 prompts / 周;GLM-5.1 高峰期按更高倍率扣除额度,具体以官方文档为准
API 价格参考 Z.AI 文档显示 GLM-5.1 按 tokens 计费;价格与促销可能变化,请以 Pricing 页面为准
入门建议 如果目标是替代或补充 Claude Code 类编程工作流,先测 GLM-5.1 + Coding Plan;如果是后端 API 集成,按 API 价格单独评估

MiniMax(国内官网:https://www.minimaxi.com

项目 信息
厂家 / 品牌 MiniMax
国内官网主页 国内官网:https://www.minimaxi.com;国内开放平台:https://platform.minimaxi.com;Token Plan:https://platform.minimaxi.com/subscribe/token-plan
最新重点模型 MiniMax-M2.7、MiniMax-M2.7-highspeed
上下文参数 MiniMax-M2.7 系列常见标注约 204,800 tokens
模型规模 MiniMax-M2.7 模型页显示约 229B 参数
是否开源 开放权重可下载;许可证显示不是简单 MIT / Apache,商用和二次分发必须看官方 LICENSE
主要能力 软件工程、代码安全、办公文档、Agent Teams、多工具协同、长程任务、文本 / 语音 / 图像 / 视频 / 音乐多模态生态
是否有 Token Plan 有。MiniMax 国内开放平台明确提供 Token Plan,官方文档说明这是此前 Coding Plan 的全面升级
Token Plan 计量规则 M2.7 / M2.7-highspeed 按请求数计算,每 5 小时滚动重置;语音、图像、视频、音乐等非文本模型按每日配额计算;Token Plan API Key 与按量计费 API Key 不可互换
标准版套餐 Starter:290 元/年,M2.7 600 次请求 / 5 小时;Plus:490 元/年,1,500 次请求 / 5 小时;Max:1,190 元/年,4,500 次请求 / 5 小时;每周可用额度约为 5 小时额度的 10 倍
极速版套餐 Plus-极速版:980 元/年,M2.7-highspeed 1,500 次请求 / 5 小时;Max-极速版:1,990 元/年,4,500 次请求 / 5 小时;Ultra-极速版:8,990 元/年,30,000 次请求 / 5 小时;极速版约 100 TPS,普通版约 50 TPS,具体以页面说明为准
API 按量价格参考 国内开放平台按量计费页显示 MiniMax-M2.7:输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens,缓存读取 0.42 元/百万 tokens,缓存写入 2.625 元/百万 tokens;M2.7-highspeed:输入 4.2 元/百万 tokens,输出 16.8 元/百万 tokens,缓存读取 0.42 元/百万 tokens,缓存写入 2.625 元/百万 tokens
入门建议 如果你需要“固定订阅费 + 编程 Agent + 多模态额度”,MiniMax Token Plan 是五家里最需要单独拿出来看的;不要再用国际站价格判断国内套餐

怎么选择

使用场景 优先看
免费网页体验、观察国产旗舰能力 DeepSeek、Kimi、Qwen
企业云上 API、国内合规和云资源整合 Qwen / 阿里云百炼、智谱 GLM
官方或平台明确 Token Plan MiniMax 国内 Token Plan、阿里云百炼 Token Plan 团队版
网页端个人会员 / 统一额度池 Kimi 会员
AI 编程工具套餐 GLM Coding Plan、MiniMax Token Plan、Kimi Code 会员权益、百炼 Coding Plan
开源权重、本地部署或二次开发 DeepSeek 开放权重、Qwen 开源系列、Kimi K2.6、GLM-5.1、MiniMax M2.7
成本优先 DeepSeek V4-Flash、MiniMax-M2.7、Qwen3.6-Flash

入门时最容易误解的几点

  1. “Token Plan”不是统一行业标准。有的是厂商自家套餐,有的是云平台聚合套餐,有的是网页端会员额度池。
  2. “有 Token Plan”不代表所有模型都支持。例如百炼文本模型页显示 qwen3.6-plus 支持,但 qwen3.6-max-preview 与 qwen3.6-flash 当前不支持。
  3. “开源”不等于“随便商用”。DeepSeek、Qwen、Kimi、GLM、MiniMax 的许可证并不完全相同,商用前要读模型页 LICENSE。
  4. “上下文很长”不等于“无限准确”。长上下文会带来成本、速度和检索质量问题,企业项目仍然需要 RAG、缓存和评测。
  5. “订阅套餐”适合交互式工具和个人 / 团队开发,企业后端自动化调用通常仍要回到 API 按量计费或企业合同。

参考来源