火山引擎Coding Plan被指不透明说好按调用次数但实际还会按Tokens消耗双层计费

#人工智能火山引擎 Coding Plan 被指不透明，说好的按次数计算配额但实际上还会按照 Tokens 消耗量双层计费。例如 Pro 订阅 5 小时窗口 6,000 次调用，如果单次调用消耗的 Tokens 非常多，则可能会被字节计费为 2 次、3 次甚至更多次扣费，这会导致窗口期内配额被快速消耗。查看全文：https://ourl.co/112469

目前国内云计算厂商提供的 Coding Plan 套餐基本都是按照国际标准提供配额的，例如 5 小时提供的调用次数、每周提供的调用次数和每月提供的调用次数。

用户可以在时间窗口里按照调用次数使用，只要调用次数没有超标那就可以继续使用直到触发调用次数阈值，但字节跳动火山引擎的 Coding Plan 套餐情况有些不同。

有网友发现自己使用火山引擎的 Coding Plan 消耗速度要比其他平台更快，于是联系客服对线并且得到让人摸不着头脑的答复：在使用过程中单次模型调用消耗的 Tokens 若远高于平均调用的消耗，则周期内预估的可调用次数也会远小于 6,000 次。

网友订阅的是火山方舟 Coding Plan Pro 套餐，套餐价格为每月 200 元，套餐内配额为每 5 小时最多 6,000 次请求，每周最多 45,000 次请求，每月最多 90,000 次请求。

那如何理解火山引擎客服的回复呢？

简单来说就是方舟 Coding Plan 订阅方案不仅按照调用次数计费，还同时按照 Tokens 使用量计费，即如果单次调用的 Token 使用量非常高，那火山引擎可能就会将这次调用按照 2 次、3 次甚至更多次扣费，这就导致用户可能会快速将套餐内配额消耗掉。

在执行复杂任务时智能体一次调用动辄消耗十万甚至几十万 Tokens，如果按照火山引擎这种计费方案，那开发者就没必要订阅 Coding Plan 套餐了，还不如直接使用 Tokens 按量计费使用套餐。

这种不透明的计费方式可能会让用户感到困惑并降低用户信任，所以建议使用火山引擎 Coding Plan 订阅的用户观察下使用配额消耗，如果发现配额消耗太快多半也是触发此类双层计费机制。

via V2EX