完整对比：Claude Opus 4.7 vs DeepSeek / Kimi / MiniMax / GLM / Qwen

假设条件：90% 缓存命中率，用量 681.13M input + 5.08M output

📊 加权"到手价" + 实际账单一览（按总价升序）

模型	Input 加权价/M	Output/M	总账单 (USD)	总账单 (CNY)	vs Opus
DeepSeek V4-Flash	$0.0165	$0.28	$12.66	¥91	🔥 64.5× 便宜
DeepSeek V4-Pro（促销，至 5/31）	$0.047	$0.87	$36.30	¥261	22.5× 便宜
MiniMax M2	$0.053	$1.00	$40.84	¥294	20× 便宜
GLM-4.6（智谱）	$0.138	$1.74	$102.84	¥741	7.9× 便宜
DeepSeek V4-Pro（标准价，6/1 后）	$0.187	$3.48	$145.06	¥1,045	5.6× 便宜
Kimi K2 / K2-Thinking	$0.195	$2.50	$145.53	¥1,048	5.6× 便宜
Qwen3-Max（阿里通义）	$0.218	$3.90	$168.32	¥1,212	4.9× 便宜
Kimi K2-Turbo（高速版）	$0.250	$8.00	$210.96	¥1,519	3.9× 便宜
Claude Opus 4.7	$1.01	$25.00	$816.75	¥5,880	1× （基准）

💡 关键洞察

1️⃣ Input 价差没那么大，Output 价差才是账单大头

模型	Output 价差 vs Opus
DeepSeek V4-Flash	89×
DeepSeek V4-Pro 促销	28.7×
MiniMax M2	25×
Kimi K2	10×
GLM-4.6	14.4×
Qwen3-Max	6.4×
Kimi K2-Turbo	3.1× ❗

你这次只生成了 5M output 就花了 $127；如果是写 agent 跑长流程、output 上百 M 的场景，Opus 的账单会断崖式上升。

2️⃣ "便宜不等于差"——国产第一梯队 (V4-Pro / Kimi K2 / GLM / Qwen) 在 SWE-Bench / LiveCodeBench 等编码基准上已经全部 ≥ Sonnet 4.6，部分项目逼近 Opus 4.7

3️⃣ 几个时间敏感的"坑"

模型	注意事项
Kimi K2	2026-05-25 正式停服，要切到 K2.6
DeepSeek V4-Pro	2026-05-31 后促销结束，价格 ×4
GLM-4.6	2026-01-20 已标记 deprecated，推荐用 GLM-4.7

🎯 选型矩阵（按使用场景）

你想干嘛	首选	备选
极致省钱跑 agent / 批量任务	DeepSeek V4-Flash	MiniMax M2
日常编码主力（性价比之王）	DeepSeek V4-Pro（5/31 前）	Kimi K2 / GLM-4.6
中文创作、长上下文文档	Kimi K2.6	Qwen3-Max（262K context）
国内合规要求 / 私有化	GLM-4.6 / Qwen3-Max	MiniMax M2
多模态 + 工具调用强	Qwen3-Max	GLM-4.6
关键攻坚战、最强推理	Claude Opus 4.7（值！）	DeepSeek V4-Pro

📝 一句话总结

同一份 6.8 亿 token 的工作量，最便宜（V4-Flash ¥91）到最贵（Opus ¥5,880）相差 64 倍。现实里的最优策略是混合路由：
90% 的活儿丢给 V4-Pro / Kimi K2 / MiniMax M2（¥260–¥1,000 区间，完全够用）
10% 真正搞不定的硬骨头再交给 Opus
预计能把 ¥5,880 的账单砍到 ¥800 以内，效果几乎无感

完整对比：Claude Opus 4.7 vs DeepSeek / Kimi / MiniMax / GLM / Qwen

📊 加权"到手价" + 实际账单一览（按总价升序）

💡 关键洞察

1️⃣ Input 价差没那么大，Output 价差才是账单大头

2️⃣ "便宜不等于差"——国产第一梯队 (V4-Pro / Kimi K2 / GLM / Qwen) 在 SWE-Bench / LiveCodeBench 等编码基准上已经全部 ≥ Sonnet 4.6，部分项目逼近 Opus 4.7

3️⃣ 几个时间敏感的"坑"

🎯 选型矩阵（按使用场景）

📝 一句话总结

相关阅读