模型教程

AI 入门：DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 最新模型速览

只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型，并按厂家单独列出官网、上下文、模型规模、是否开源、API 价格、网页端订阅与 Token Plan 信息。

2026-04-2812 分钟教程 / AI入门

更新时间：2026-04-28。本文只保留 DeepSeek、Qwen、Kimi、智谱 GLM、MiniMax 五家国内主流模型。这里把“Token Plan / 订阅套餐 / Coding Plan”分开写：有些厂商自家就叫 Token Plan，有些是网页端会员或云平台聚合套餐，不能混成一类。

先看结论

如果你是 AI 入门用户，可以先按这个思路理解：

想看极长上下文和低价 API：先看 DeepSeek V4。
想要阿里云生态、国内企业接入和百炼 Token Plan：先看 Qwen / 百炼。
想做长文档、多模态 Agent、Kimi Code 和个人网页端会员：先看 Kimi K2.6。
想做长程 Coding Agent、Claude Code / Cline / OpenCode 替代：先看 GLM-5.1 和 GLM Coding Plan。
想要国内开放平台 Token Plan、工程 Agent 与多模态额度：先看 MiniMax M2.7。

说明：下表里的“是否有 Token Plan”优先指厂商自家官网或国内开放平台明确命名为 Token Plan 的套餐。阿里云百炼等云平台的聚合型 Token Plan 会单独标注，避免误以为是模型厂商自家套餐。

DeepSeek（国内官网：https://www.deepseek.com/zh）

项目	信息
厂家 / 品牌	深度求索 DeepSeek
国内官网主页	https://www.deepseek.com/zh；API 文档：https://api-docs.deepseek.com/zh-cn
最新重点模型	deepseek-v4-flash、deepseek-v4-pro
上下文参数	官方 API 价格页显示上下文长度 1M，最大输出 384K
模型规模	官方 API 价格页未在价格表披露参数规模；开放权重或模型卡信息请以 DeepSeek 官方发布页为准
是否开源	DeepSeek 长期提供部分开放权重模型；具体到 V4 系列请以官方模型页和许可证为准
主要能力	思考 / 非思考模式、长上下文、工具调用、JSON Output、Anthropic API 兼容、FIM 补全等
是否有 Token Plan	自家官方暂未看到名为 Token Plan / Coding Plan 的订阅套餐
Token Plan 相关信息	DeepSeek 官方 API 是按 tokens 计费，从充值余额或赠送余额扣减；阿里云百炼 Token Plan 团队版支持 deepseek-v3.2，但这是百炼聚合套餐，不等同于 DeepSeek 官方自家 Token Plan
API 价格参考	deepseek-v4-flash：缓存命中输入 0.02 元/百万 tokens，缓存未命中输入 1 元/百万 tokens，输出 2 元/百万 tokens；deepseek-v4-pro：官方当前价格页显示缓存命中输入 0.025 元/百万 tokens、缓存未命中输入 3 元/百万 tokens、输出 6 元/百万 tokens，优惠期以官方页面为准
入门建议	想低成本做 API 试验、长上下文阅读和工程任务评估，可以先用 flash 做基线，再用 pro 处理高难任务

Qwen / 通义千问（国内官网：https://qwen.ai）

项目	信息
厂家 / 品牌	阿里云 / 通义千问 Qwen / Model Studio 百炼
国内官网主页	https://qwen.ai；百炼控制台与文档：https://bailian.console.aliyun.com、https://help.aliyun.com/zh/model-studio
最新重点模型	qwen3.6-max-preview、qwen3.6-plus、qwen3.6-flash；开源侧可关注 Qwen3 / Qwen3.6 系列
上下文参数	百炼文档显示 qwen3.6-plus 与 qwen3.6-flash 支持 1M 上下文，qwen3.6-max-preview 支持 256K；最大输出 64K
模型规模	商业 API 模型未统一公开总参数；开源模型按具体权重区分，如 Qwen3 系列 0.6B、1.7B、4B、8B、14B、32B、30B-A3B、235B-A22B 等
是否开源	Qwen 有大量开源权重；商业 API 的 Max / Plus / Flash 不等同全部开源
主要能力	长上下文、思考模式、Function Calling、内置工具、结构化输出、企业云上接入、批量调用
是否有 Token Plan	有，但主要在阿里云百炼 Token Plan 团队版体系里使用；百炼文本模型页显示 qwen3.6-plus 支持 Token Plan，qwen3.6-max-preview 与 qwen3.6-flash 当前不支持 Token Plan
Token Plan 具体信息	百炼 Token Plan 团队版以 Credits 统一计量，支持文本生成与图像生成模型；支持模型示例包括 qwen3.6-plus、glm-5、MiniMax-M2.5、deepseek-v3.2；目前文档说明仅支持华北 2（北京）地域
Token Plan 套餐	标准坐席 198 元/席/月，25,000 Credits；高级坐席 698 元/席/月，100,000 Credits；尊享坐席 1,398 元/席/月，250,000 Credits；共享用量包 5,000 元/个，625,000 Credits
API 价格参考	百炼价格变化快，Qwen3.6-Max-Preview、Plus、Flash 的输入/输出价格请以百炼文本模型价格页为准；同一模型在不同地域、快照、促销期可能不同
入门建议	公司已经在阿里云、需要权限、账单、合规和多模型统一管理时，优先测试百炼；只做模型能力评估时，可以先用 qwen3.6-plus 做 Token Plan / Coding Plan 兼容性验证

Kimi（月之暗面）（国内官网：https://www.kimi.com）

项目	信息
厂家 / 品牌	月之暗面 Moonshot AI / Kimi
国内官网主页	https://www.kimi.com；开放平台：https://platform.kimi.com；Kimi Code：https://www.kimi.com/code/zh
最新重点模型	Kimi K2.6
上下文参数	Kimi K2.6 API 与模型资料常见标注为 256K / 262,144 tokens
模型规模	Kimi K2.6 模型资料显示约 1T 总参数 / 32B 激活，MoonViT 视觉编码器约 400M 参数
是否开源	Kimi K2.6 有开放权重版本；许可证和商用条款需看官方模型页
主要能力	长程 Coding、视觉理解、视频输入、Agent Swarm、Kimi Code、Kimi Claw、工具调用、思考 / 非思考模式
是否有 Token Plan	Kimi 自家网页端没有把会员套餐命名为 Token Plan；它采用 Kimi 会员统一额度池，按 token 消耗，会员功能共享额度
网页端会员与额度	Kimi 会员包含 Adagio 免费、Andante 49 元/月、Moderato 99 元/月、Allegretto 199 元/月、Allegro 699 元/月；官方帮助中心说明所有套餐采用统一额度池，额度可跨对话、Agent、PPT、深度研究、Kimi Code、Kimi Claw 等功能共享
Kimi Code 订阅关系	Kimi Code 是 Kimi 会员计划中面向代码开发的权益，Andante 起可使用；额度作为会员权益之一，通常无需为 Kimi Code 单独额外付费，但会消耗对应套餐额度
API 价格参考	Kimi K2.6 API 按 tokens 计费；常见价格口径为缓存命中输入、缓存未命中输入与输出分档，具体人民币 / 美元价格以 Kimi 开放平台价格页为准
入门建议	个人网页端重度使用文档、PPT、Agent、代码任务时看会员；企业系统集成仍应走 Kimi 开放平台 API，并单独核算 token 成本

智谱 GLM / Z.AI（国内官网：https://www.bigmodel.cn）

项目	信息
厂家 / 品牌	智谱 AI / Z.AI / GLM
国内官网主页	https://www.bigmodel.cn；开发文档：https://docs.z.ai
最新重点模型	GLM-5.1
上下文参数	GLM-5.1 官方资料常见标注约 200K tokens；百炼三方模型 glm-5 文档显示约 198K
模型规模	GLM-5.1 模型页显示约 754B 参数
是否开源	GLM-5.1 有开放权重版本，模型页标注 MIT License；企业商用仍建议核对模型卡与官方条款
主要能力	长程 Coding Agent、工具调用、结构化输出、上下文缓存、MCP、Claude Code / Cline / OpenCode 类开发工作流
是否有 Token Plan	自家官方目前主推 GLM Coding Plan，不叫 Token Plan；阿里云百炼 Token Plan 团队版支持 glm-5，但这是百炼聚合套餐
Coding Plan 具体信息	GLM Coding Plan 面向 AI 编程工具，官方文档写明支持 Claude Code、Cline、OpenCode 等；所有套餐支持 GLM-5.1、GLM-5-Turbo、GLM-4.7、GLM-4.5-Air
Coding Plan 套餐额度	起价 18 美元/月；Lite 约 80 prompts / 5 小时、400 prompts / 周；Pro 约 400 prompts / 5 小时、2,000 prompts / 周；Max 约 1,600 prompts / 5 小时、8,000 prompts / 周；GLM-5.1 高峰期按更高倍率扣除额度，具体以官方文档为准
API 价格参考	Z.AI 文档显示 GLM-5.1 按 tokens 计费；价格与促销可能变化，请以 Pricing 页面为准
入门建议	如果目标是替代或补充 Claude Code 类编程工作流，先测 GLM-5.1 + Coding Plan；如果是后端 API 集成，按 API 价格单独评估

MiniMax（国内官网：https://www.minimaxi.com）

项目	信息
厂家 / 品牌	MiniMax
国内官网主页	国内官网：https://www.minimaxi.com；国内开放平台：https://platform.minimaxi.com；Token Plan：https://platform.minimaxi.com/subscribe/token-plan
最新重点模型	MiniMax-M2.7、MiniMax-M2.7-highspeed
上下文参数	MiniMax-M2.7 系列常见标注约 204,800 tokens
模型规模	MiniMax-M2.7 模型页显示约 229B 参数
是否开源	开放权重可下载；许可证显示不是简单 MIT / Apache，商用和二次分发必须看官方 LICENSE
主要能力	软件工程、代码安全、办公文档、Agent Teams、多工具协同、长程任务、文本 / 语音 / 图像 / 视频 / 音乐多模态生态
是否有 Token Plan	有。MiniMax 国内开放平台明确提供 Token Plan，官方文档说明这是此前 Coding Plan 的全面升级
Token Plan 计量规则	M2.7 / M2.7-highspeed 按请求数计算，每 5 小时滚动重置；语音、图像、视频、音乐等非文本模型按每日配额计算；Token Plan API Key 与按量计费 API Key 不可互换
标准版套餐	Starter：290 元/年，M2.7 600 次请求 / 5 小时；Plus：490 元/年，1,500 次请求 / 5 小时；Max：1,190 元/年，4,500 次请求 / 5 小时；每周可用额度约为 5 小时额度的 10 倍
极速版套餐	Plus-极速版：980 元/年，M2.7-highspeed 1,500 次请求 / 5 小时；Max-极速版：1,990 元/年，4,500 次请求 / 5 小时；Ultra-极速版：8,990 元/年，30,000 次请求 / 5 小时；极速版约 100 TPS，普通版约 50 TPS，具体以页面说明为准
API 按量价格参考	国内开放平台按量计费页显示 MiniMax-M2.7：输入 2.1 元/百万 tokens，输出 8.4 元/百万 tokens，缓存读取 0.42 元/百万 tokens，缓存写入 2.625 元/百万 tokens；M2.7-highspeed：输入 4.2 元/百万 tokens，输出 16.8 元/百万 tokens，缓存读取 0.42 元/百万 tokens，缓存写入 2.625 元/百万 tokens
入门建议	如果你需要“固定订阅费 + 编程 Agent + 多模态额度”，MiniMax Token Plan 是五家里最需要单独拿出来看的；不要再用国际站价格判断国内套餐

怎么选择

使用场景	优先看
免费网页体验、观察国产旗舰能力	DeepSeek、Kimi、Qwen
企业云上 API、国内合规和云资源整合	Qwen / 阿里云百炼、智谱 GLM
官方或平台明确 Token Plan	MiniMax 国内 Token Plan、阿里云百炼 Token Plan 团队版
网页端个人会员 / 统一额度池	Kimi 会员
AI 编程工具套餐	GLM Coding Plan、MiniMax Token Plan、Kimi Code 会员权益、百炼 Coding Plan
开源权重、本地部署或二次开发	DeepSeek 开放权重、Qwen 开源系列、Kimi K2.6、GLM-5.1、MiniMax M2.7
成本优先	DeepSeek V4-Flash、MiniMax-M2.7、Qwen3.6-Flash

入门时最容易误解的几点

“Token Plan”不是统一行业标准。有的是厂商自家套餐，有的是云平台聚合套餐，有的是网页端会员额度池。
“有 Token Plan”不代表所有模型都支持。例如百炼文本模型页显示 qwen3.6-plus 支持，但 qwen3.6-max-preview 与 qwen3.6-flash 当前不支持。
“开源”不等于“随便商用”。DeepSeek、Qwen、Kimi、GLM、MiniMax 的许可证并不完全相同，商用前要读模型页 LICENSE。
“上下文很长”不等于“无限准确”。长上下文会带来成本、速度和检索质量问题，企业项目仍然需要 RAG、缓存和评测。
“订阅套餐”适合交互式工具和个人 / 团队开发，企业后端自动化调用通常仍要回到 API 按量计费或企业合同。

参考来源

DeepSeek 官方资料：DeepSeek 中文官网、DeepSeek API 模型与价格
Qwen / 阿里云百炼官方资料：百炼文本生成模型、百炼 Token Plan 团队版概述
Kimi 官方资料：Kimi 会员套餐价格与权益、Kimi Agent 额度与计费、Kimi Code
智谱 GLM 官方资料：GLM Coding Plan、Z.AI 文档
MiniMax 国内官方资料：MiniMax 国内官网、MiniMax 国内开放平台、MiniMax Token Plan、Token Plan 概要、MiniMax 国内按量计费