简单透明的定价

一个 API 接入所有主流大模型,订阅享更高配额,按量付费用多少算多少

1 Token ≈ 1.5 个中文字符

加载中...

为什么选择我们?

对比各平台 Coding Plan 定价,一个订阅全量模型,配额更高、能力更强

对比项千木百炼 Coding智谱 CodingKimi Coding
可用模型20+ 模型仅部分模型仅 GLM 系列仅 K2.5
API 调用
智能路由
语义缓存

对比总结:其他平台仅提供单一厂商模型和基础 API 调用,千木(SilvaMux)聚合 20+ 主流大模型,并提供智能路由和语义缓存等高级能力,帮助开发者在一个订阅内获得更强大的模型接入体验。

配额消耗规则

模型消费系数不同模型消耗不同配额

每次请求基础消耗为 1.0,实际消耗 = 基础 × 模型系数 × 时段系数 × 请求大小系数

系数模型
1.0x性价比模型(默认)
2.0x旗舰模型
时段系数不同时段费用不同

凌晨和深夜请求享受折扣,高峰时段系数略高

时段时间系数
凌晨00:00–06:000.6x
上午06:00–09:001.0x
工作时间09:00–18:002.0x
晚间高峰18:00–22:001.2x
深夜22:00–24:001.0x
请求大小系数大请求消耗更多配额

按请求总 Token 数分档,小请求享受折扣

档位Token 范围系数
小型≤ 1,0001.0x
中型≤ 8,0001.5x
大型≤ 32,0002.0x
超大型> 32,0004.0x

消费计算公式

实际消耗 = 1.0 × 模型系数 × 时段系数 × 请求大小系数

示例:凌晨使用 DeepSeek V3.2 发送 500 Token 请求 → 1.0 × 0.6 × 1.0 = 0.6 配额单位

常见问题

如何开始使用 API?
注册账号后,在控制台创建 API Key,将 Base URL 改为我们的网关地址即可。如果你已经使用 OpenAI SDK,只需修改 base_url 参数,无需更改其他代码。
订阅和按量付费怎么选?
如果你的月用量稳定且较大,订阅套餐更划算——配额更高、单价更低。如果用量波动大或刚开始评估,PAYG 按量付费更灵活,用多少付多少。
PAYG 的梯度价格怎么计算?
每个模型按单次请求的 Token 总数(输入 + 输出)分档计价,但不同模型的档位 breakpoints 和单价完全独立。例如 GLM-4.5 Air 仅分 2 档(≤1K / 无上限),而 GPT-4o 分 4 档(≤1K / ≤8K / ≤32K / 无上限)。同一模型的输入和输出价格也可不同。请求完成后自动按对应档位的百万 Token 单价计费,无需手动选择。
配额消耗是怎么计算的?
每次请求消耗 = 1.0 × 模型系数 × 时段系数 × 请求大小系数。例如凌晨使用经济型模型发送小请求,消耗仅为 0.3 个配额单位。详见上方「配额消耗规则」。
配额用完了怎么办?
系统会返回 HTTP 429 状态码。你可以等待配额窗口重置(5h / 7d / 月),或升级到更高套餐获取更多配额。季付和年付 Pro 套餐提供更高的配额上限。
支持流式输出吗?
支持。API 完全兼容 OpenAI 的 SSE 流式输出格式,设置 stream: true 即可。