API 中转站倍率怎么算:充值倍率、分组倍率和最终价格怎么看
很多人第一次用 API 中转站,会被各种“倍率”绕晕。
有的站写 0.1 倍率,有的站写 1 元 = 10 额度,还有的站直接显示每 1M token 的输入价、输出价、缓存价。几个数字放在一起,如果没有先搞清楚口径,很容易只看到“倍率低”,却没看懂最终到底贵不贵。
这篇用比较朴素的方式,把 API 中转站常见的价格逻辑讲清楚。
1. 先分清两个倍率
中转站里常见的倍率,通常至少有两层:
充值倍率
分组倍率 / 模型倍率
充值倍率说的是你花多少钱,账户里得到多少额度。
比如:
1 元 = 10 额度
这就是充值侧的换算。这里的“额度”不一定等于人民币,也不一定等于美元,它只是这个站内部的计价单位。不同站的额度口径可能不同,所以不能只看“送多少额度”就判断便宜。
分组倍率说的是某一组模型按基准价的多少倍计费。
比如:
default 分组 = 0.1x
如果这个站的基准价确实按官方 API 价格来算,那么 0.1x 大致可以理解为官方价格的 10%。但这里有一个前提:基准价要正常。如果站点先把基准价抬高,再写一个低倍率,最终价格不一定低。
2. 最终价格要看组合
判断一个 API 中转站价格,不能只看充值倍率,也不能只看分组倍率。
更接近真实成本的判断方式是:
最终成本 ≈ 模型基准价 × 分组倍率 ÷ 充值倍率
这里的充值倍率指“每 1 元能换多少额度”。如果一个站写 1 元 = 10 额度,那充值倍率就是 10。
举个简化例子。
假设某个模型官方参考价是:
输入:5 / 1M tokens
输出:30 / 1M tokens
如果某个中转站分组倍率是 0.1x,并且基准价就是官方价,那么站内模型计价可能变成:
输入:0.5 / 1M tokens
输出:3 / 1M tokens
这时你还要继续看充值比例。如果充值是 1 元 = 10 额度,那么每 1 个额度的实际成本就是 0.1 元。最终换成人民币后,才是你真正要付出的成本。
所以,低倍率只是第一眼的营销标签,最终价格一定要看模型页展示的输入价、输出价、缓存价,再结合充值换算。
3. 为什么有的站看起来“送很多”
很多中转站注册会送额度。
比如一个站送 200 额度,另一个站送 20 额度。单看数字,前者好像多十倍。但如果前者按 1.0x 计费,后者按 0.1x 计费,实际可用量可能差不多。
这也是为什么看 API 中转站时,不能只看:
注册送多少
充值送多少
倍率是多少
更应该看:
模型最终输入价
模型最终输出价
缓存 token 价格
充值额度换算
请求日志里实际扣了多少
如果一个站只展示大额赠送,却不清楚展示模型最终价格,就需要多留一个心眼。
4. 缓存价格也很重要
很多人只看输入价和输出价,但忽略了缓存价格。
对于 Cursor、Cline、Continue、Dify、Cherry Studio 这类工具来说,系统提示词、项目上下文、多轮对话前缀经常会重复。上游如果支持 prompt caching,重复命中的输入 token 通常会按更低价格计费。
所以模型价格最好分开看:
input tokens
output tokens
cache tokens
缓存命中率高的场景,实际花费可能明显低于只按普通输入 token 估算的结果。
但这也反过来说明:一个合格的 API 中转站,最好能在模型市场或请求日志里把 input、output、cache 分开显示。否则用户很难判断钱花在哪里。
5. 首字速度和价格不是一回事
价格看倍率,体验看首字速度和稳定性。
首字速度指的是从发出请求到收到第一个 token 的时间。它主要受几件事影响:
- 上游模型本身速度
- 中转服务器到上游的线路质量
- 请求上下文长度
- 推理模型的思考时间
- 中转站服务器是否过载
很多人会误以为带宽越大,首字越快。其实带宽主要影响吞吐,首字更接近延迟问题。对于普通单次请求,线路往返、上游响应和服务器负载通常更关键。
所以选中转站时,不要只看“低倍率”。如果一个站很便宜,但高峰期经常慢、失败、排队,实际体验也会很差。
6. 低倍率常见的营销写法
市面上常见的几种说法:
0.1 倍率
低至官方价 10%
注册送 200 刀
1 元 10 刀
超低价 token
这些说法不一定有问题,但需要看完整上下文。
比较稳的判断顺序是:
- 看模型页最终每 1M token 价格
- 看充值金额和账户额度怎么换算
- 看是否有独立 API key 和硬额度
- 看请求日志是否能查到每次 input/output/cache tokens
- 用小额充值或免费额度跑真实请求
如果一个站只强调倍率,不展示最终价格、不展示日志、不方便查扣费明细,那就算数字看起来漂亮,也不一定适合长期用。
7. 开发者更应该关注什么
如果你只是偶尔聊天,价格可能是第一优先级。
但如果你在用 Cursor、Cline、Continue、Dify、Cherry Studio,或者自己写程序调用 OpenAI-compatible API,那么更应该关注这些能力:
- 是否支持标准 OpenAI-compatible
base_url - 是否能给不同项目创建独立 API key
- 是否能给 key 设置硬额度
- 是否能查看每次请求日志
- 是否能看到 input / output / cache tokens
- 模型名称是否清晰
- 出错时是否能看到状态码和失败原因
AI 编程工具很容易因为长上下文、自动重试、循环任务导致 token 消耗变快。没有独立 key 和硬额度,排查起来会很麻烦。
8. Wappkit API 的价格口径
Wappkit API 更适合把自己理解成一个面向开发者的 OpenAI-compatible API Gateway。
在价格口径上,建议优先看模型市场里的最终价格,而不是只看某个倍率标签。倍率可以帮助理解分组,但真正扣费时,用户更应该关注:
输入价格
输出价格
缓存价格
请求日志
API key 额度
官网:
https://api.wappkit.com
OpenAI-compatible API 示例入口:
https://api.wappkit.com/v1
如果你正在比较 API中转站、AI中转站、GPT中转站、Token中转站,建议不要只看“倍率低不低”。真正适合长期使用的中转站,应该让你能算清楚价格,也能查清楚每一次请求为什么扣费。