Chaos 加权平均是指在输入 Token 中,综合考虑缓存命中和缓存未命中两种不同价格后计算出的有效平均输入价格。
公式示例(假设缓存命中率 H):
有效输入单价 = (H × .25) + ((1 - H) × 3) 元 / 百万 Tokens
—
使用 1 亿 Token(100,000,000 Tokens) 的估算花销
以 DeepSeek-V4-Pro 当前 2.5 折特惠价格计算(输出按 6 元/百万):
| 场景 | 假设条件 | 输入有效单价 | 输入总费用 | 输出总费用(假设输出占输入 20%) | 总费用(元) |
| 全缓存命中 | 命中率 100% | .25 元/M | 25 | 120(输出 200 万) | 145 |
| 典型混合 | 命中率 70% | 1.025 元/M | 102.5 | 120 | 222.5 |
| 低缓存 | 命中率 30% | 2.175 元/M | 217.5 | 120 | 337.5 |
| 全未命中 | 命中率 % | 3 元/M | 300 | 120 | 420 |
说明
- 1 亿 Token 默认按输入计算;输出按常见对话比例 15-25% 估算(这里用 20% 即 200 万输出 Token)。
- 实际费用取决于你的缓存命中率和输出/输入比例。
- 如果全部只算输入(无输出),则费用范围为 25~300 元。
其他主流模型当前大致价格(非特惠,供对比,2026 年 4 月参考):
- GPT-4o:输入 ≈ 15-20 元/M,输出 ≈ 60 元/M → 1 亿 Token 混合 ≈ 200-350 元
- Claude 3.5/4:输入 ≈ 18-25 元/M → 1 亿 Token 混合 ≈ 250-400 元
- Gemini 2. Pro:输入 ≈ 10-15 元/M → 1 亿 Token 混合 ≈ 150-280 元
- DeepSeek-V4-Pro(当前特惠):远低于 500 元,性价比极高。
如果你提供预计缓存命中率和输出比例,我可以给出更精确的计算。