logologo
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
产品计费
API说明
控制台介绍
相关协议
文档中心
产品计费资源包抵扣规则

资源包抵扣规则


本文为您介绍快手万擎平台资源包计费方式及抵扣规则。如需查询各模型的计费公式及单价请参考模型服务价格。


以下规则适用平台所有大模型类资源包,包括新用户赠送体验包及线上购买资源包:

1、资源包token:

资源包token是实际扣减单位,由于不同模型的输入、输出、缓存命中的成本不同,为保证每位用户的公平性,会基于用户使用的不同类型实际token消耗✖️抵扣系数进行资源包余量扣减。

实际消耗token以控制台-用量统计页面为准实际抵扣资源包token以控制台-账单详情-账单明细为准


2、抵扣规则:

每个模型的资源包token会以其「输入」价格为扣减系数1,「输出」及「缓存」会按照输入价格进行等比换算系数抵扣。

例如:

模型A的输入价格为2元/百万token,输出价格为8元/百万token,输出价格为8元/百万token,命中缓存价格为0.4元/百万token;

那么用户每消耗1个input_token(不含cache)则抵扣1个资源包token,每消耗1个output_token则抵扣4个资源包token ,每命中1个prefix_cache则抵扣0.2个资源包token 。

对于按长度分段计价的模型,以最小分段的输入token为系数1,其余类型的用量等比换算系数抵扣。

以KAT-Coder-Pro V1为例:

「0-32K」输入token单价为4元/百万token,输出价格为16元/百万token,命中缓存价格为0.8元/百万token;「32-128K」输入token为6元/百万token,输出价格为24元/百万token,命中缓存价格为1.2元/百万token;

那么用户每消耗1个「0-32K」input_token(不含cache)则抵扣1个资源包token,每消耗1个「0-32K」output_token则抵扣4个资源包token ,每命中1个「0-32K」prefix_cache则抵扣0.2个资源包token; 每消耗1个「32-128K」input_token(不含cache)则抵扣1.5个资源包token,每消耗1个「32-128K」output_token则抵扣6个资源包token ,每命中1个「32-128K」prefix_cache则抵扣0.3个资源包token。

token类型原价(元/百万token)资源包抵扣系数
输入0-32K:4元/百万token
32-128K:6元/百万token
128-256K:10元/百万token
1
1.5
2.5
缓存0-32K:0.8元/百万token
32-128K:1.2元/百万token
128-256K:2元/百万token
0.2
0.3
0.5
输出0-32K: 16元/百万token
32-128K:24元/百万token
128-256K:40元/百万token
4
6
10


3、抵扣周期:

系统按小时出账,账单出账时间通常在当前计费周期结束后1-2小时左右,具体以系统实际出账时间为准。例如:16:00-17:00 的账单约在 18:00-19:00 出账。

出账后会自动使用资源包token进行抵扣,若资源包余量不足以抵扣,会自动产生后付费账单。


4、抵扣顺序:

若存在多个资源包,抵扣顺序以到期时间最近的为优先抵扣;若到期时间相同,以最早生效的资源包为优先抵扣。





上一篇:模型计费说明下一篇:税率与发票
该篇文档内容是否对您有帮助?
有帮助没帮助