#人工智能 火山引擎 Coding Plan 被指不透明,说好的按次数计算配额但实际上还会按照 Tokens 消耗量双层计费。例如 Pro 订阅 5 小时窗口 6,000 次调用,如果单次调用消耗的 Tokens 非常多,则可能会被字节计费为 2 次、3 次甚至更多次扣费,这会导致窗口期内配额被快速消耗。查看全文:https://ourl.co/112469
目前国内云计算厂商提供的 Coding Plan 套餐基本都是按照国际标准提供配额的,例如 5 小时提供的调用次数、每周提供的调用次数和每月提供的调用次数。
用户可以在时间窗口里按照调用次数使用,只要调用次数没有超标那就可以继续使用直到触发调用次数阈值,但字节跳动火山引擎的 Coding Plan 套餐情况有些不同。
有网友发现自己使用火山引擎的 Coding Plan 消耗速度要比其他平台更快,于是联系客服对线并且得到让人摸不着头脑的答复:在使用过程中单次模型调用消耗的 Tokens 若远高于平均调用的消耗,则周期内预估的可调用次数也会远小于 6,000 次。
网友订阅的是火山方舟 Coding Plan Pro 套餐,套餐价格为每月 200 元,套餐内配额为每 5 小时最多 6,000 次请求,每周最多 45,000 次请求,每月最多 90,000 次请求。
那如何理解火山引擎客服的回复呢?
简单来说就是方舟 Coding Plan 订阅方案不仅按照调用次数计费,还同时按照 Tokens 使用量计费,即如果单次调用的 Token 使用量非常高,那火山引擎可能就会将这次调用按照 2 次、3 次甚至更多次扣费,这就导致用户可能会快速将套餐内配额消耗掉。
在执行复杂任务时智能体一次调用动辄消耗十万甚至几十万 Tokens,如果按照火山引擎这种计费方案,那开发者就没必要订阅 Coding Plan 套餐了,还不如直接使用 Tokens 按量计费使用套餐。
这种不透明的计费方式可能会让用户感到困惑并降低用户信任,所以建议使用火山引擎 Coding Plan 订阅的用户观察下使用配额消耗,如果发现配额消耗太快多半也是触发此类双层计费机制。
via V2EX

