完整对比:Claude Opus 4.7 vs DeepSeek / Kimi / MiniMax / GLM / Qwen

假设条件:90% 缓存命中率,用量 681.13M input + 5.08M output

📊 加权"到手价" + 实际账单一览(按总价升序)

模型Input 加权价/MOutput/M总账单 (USD)总账单 (CNY)vs Opus
DeepSeek V4-Flash
$0.0165
$0.28
$12.66
¥91
🔥 64.5× 便宜
DeepSeek V4-Pro(促销,至 5/31)
$0.047
$0.87
$36.30
¥261
22.5× 便宜
MiniMax M2
$0.053
$1.00
$40.84
¥294
20× 便宜
GLM-4.6(智谱)
$0.138
$1.74
$102.84
¥741
7.9× 便宜
DeepSeek V4-Pro(标准价,6/1 后)
$0.187
$3.48
$145.06
¥1,045
5.6× 便宜
Kimi K2 / K2-Thinking
$0.195
$2.50
$145.53
¥1,048
5.6× 便宜
Qwen3-Max(阿里通义)
$0.218
$3.90
$168.32
¥1,212
4.9× 便宜
Kimi K2-Turbo(高速版)
$0.250
$8.00
$210.96
¥1,519
3.9× 便宜
Claude Opus 4.7
$1.01
$25.00
$816.75
¥5,880
1× (基准)

💡 关键洞察

1️⃣ Input 价差没那么大,Output 价差才是账单大头

模型Output 价差 vs Opus
DeepSeek V4-Flash
89×
DeepSeek V4-Pro 促销
28.7×
MiniMax M2
25×
Kimi K2
10×
GLM-4.6
14.4×
Qwen3-Max
6.4×
Kimi K2-Turbo
3.1× ❗

你这次只生成了 5M output 就花了 $127;如果是写 agent 跑长流程、output 上百 M 的场景,Opus 的账单会断崖式上升

2️⃣ "便宜不等于差"——国产第一梯队 (V4-Pro / Kimi K2 / GLM / Qwen) 在 SWE-Bench / LiveCodeBench 等编码基准上已经全部 ≥ Sonnet 4.6,部分项目逼近 Opus 4.7

3️⃣ 几个时间敏感的"坑"

模型注意事项
Kimi K2
2026-05-25 正式停服,要切到 K2.6
DeepSeek V4-Pro
2026-05-31 后促销结束,价格 ×4
GLM-4.6
2026-01-20 已标记 deprecated,推荐用 GLM-4.7

🎯 选型矩阵(按使用场景)

你想干嘛首选备选
极致省钱跑 agent / 批量任务
DeepSeek V4-Flash
MiniMax M2
日常编码主力(性价比之王)
DeepSeek V4-Pro(5/31 前)
Kimi K2 / GLM-4.6
中文创作、长上下文文档
Kimi K2.6
Qwen3-Max(262K context)
国内合规要求 / 私有化
GLM-4.6 / Qwen3-Max
MiniMax M2
多模态 + 工具调用强
Qwen3-Max
GLM-4.6
关键攻坚战、最强推理
Claude Opus 4.7(值!)
DeepSeek V4-Pro

📝 一句话总结

同一份 6.8 亿 token 的工作量,最便宜(V4-Flash ¥91)到最贵(Opus ¥5,880)相差 64 倍。 现实里的最优策略是 混合路由

  • 90% 的活儿丢给 V4-Pro / Kimi K2 / MiniMax M2(¥260–¥1,000 区间,完全够用)
  • 10% 真正搞不定的硬骨头再交给 Opus
  • 预计能把 ¥5,880 的账单砍到 ¥800 以内,效果几乎无感