

本文为您介绍快手万擎平台资源包计费方式及抵扣规则。如需查询各模型的计费公式及单价请参考模型服务价格。
资源包token是实际扣减单位,由于不同模型的输入、输出、缓存命中的成本不同,为保证每位用户的公平性,会基于用户使用的不同类型实际token消耗✖️抵扣系数进行资源包余量扣减。
| 实际消耗token以控制台-用量统计页面为准 | 实际抵扣资源包token以控制台-账单详情-账单明细为准 |
|---|---|
每个模型的资源包token会以其「输入」价格为扣减系数1,「输出」及「缓存」会按照输入价格进行等比换算系数抵扣。
例如:
模型A的输入价格为2元/百万token,输出价格为8元/百万token,输出价格为8元/百万token,命中缓存价格为0.4元/百万token;
那么用户每消耗1个input_token(不含cache)则抵扣1个资源包token,每消耗1个output_token则抵扣4个资源包token ,每命中1个prefix_cache则抵扣0.2个资源包token 。
对于按长度分段计价的模型,以最小分段的输入token为系数1,其余类型的用量等比换算系数抵扣。
以KAT-Coder-Pro V1为例:
「0-32K」输入token单价为4元/百万token,输出价格为16元/百万token,命中缓存价格为0.8元/百万token;「32-128K」输入token为6元/百万token,输出价格为24元/百万token,命中缓存价格为1.2元/百万token;
那么用户每消耗1个「0-32K」input_token(不含cache)则抵扣1个资源包token,每消耗1个「0-32K」output_token则抵扣4个资源包token ,每命中1个「0-32K」prefix_cache则抵扣0.2个资源包token; 每消耗1个「32-128K」input_token(不含cache)则抵扣1.5个资源包token,每消耗1个「32-128K」output_token则抵扣6个资源包token ,每命中1个「32-128K」prefix_cache则抵扣0.3个资源包token。
| token类型 | 原价(元/百万token) | 资源包抵扣系数 |
|---|---|---|
| 输入 | 0-32K:4元/百万token 32-128K:6元/百万token 128-256K:10元/百万token | 1 1.5 2.5 |
| 缓存 | 0-32K:0.8元/百万token 32-128K:1.2元/百万token 128-256K:2元/百万token | 0.2 0.3 0.5 |
| 输出 | 0-32K: 16元/百万token 32-128K:24元/百万token 128-256K:40元/百万token | 4 6 10 |
系统按小时出账,账单出账时间通常在当前计费周期结束后1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。
出账后会自动使用资源包token进行抵扣,若资源包余量不足以抵扣,会自动产生后付费账单。
若存在多个资源包,抵扣顺序以到期时间最近的为优先抵扣;若到期时间相同,以最早生效的资源包为优先抵扣。