logologo
logo
热门活动
HOT
产品
解决方案
客户价值
文档
支持与帮助
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
系统管理
产品计费
API说明
常见问题
相关协议
文档中心
相关协议快手万擎平台模型推理服务等级协议(SLA)

快手万擎平台模型推理服务等级协议(SLA)


版本生效日期:2026年4月7日

本服务等级协议(Service Level Agreement,简称"SLA")规定了快手万擎平台(下称“本平台”)向客户提供的【模型推理服务】(下称"本服务")的可用性等级指标及赔偿方案。特别提示您,除非另有约定,本协议不适用于本服务的公测、邀测、免费功能及版本。


一、定义

1.1 服务周期:一个服务周期为一个自然月。如客户使用本服务不满一个月,则以当月该服务累计使用时间作为一个服务周期。如您购买一个月本服务,服务开通日为3月15日,则包含2个服务周期,第1个服务周期指3月17日到3月31日,第2个服务周期指4月1日到4月14日。

1.2 服务周期总分钟数:按照服务周期内的总天数 × 24(小时)× 60(分钟)计算。

1.3 有效请求:快手万擎平台服务端收到的请求视为有效请求,但不包括以下类型的请求:

  • 客户的应用程序受到黑客攻击而发起的请求;
  • 来自于国外,向国内快手万擎平台模型推理服务产生的请求;
  • 未通过本平台身份验证和鉴权失败的请求、欠费请求、错误参数(状态码如下)的请求;
  • 因触发限流或配额限制返回的请求(错误参数为429:RateLimitExceeded/QuotaExhausted )。

错误参数

错误原因

400

  • InvalidParameter (参数格式错误/缺少必填参数)
  • InvalidModel (模型名称不合法)
  • InvalidRequestBody (JSON解析失败)
  • MaxTokensExceeded (max_tokens超限)
  • ContextLengthExceeded (输入token超上下文窗口)
  • InvalidPrompt (prompt/messages格式不合法)
  • EmptyInput (输入为空)

401

  • AuthenticationFailed (API Key无效/过期)
  • MissingAuthentication (未提供认证信息)

403

  • PermissionDenied (无权限访问模型)
  • AccountDisabled (账号已禁用)

404

  • ModelNotFound (模型不存在/已下线)
  • EndpointNotFound (路径不存在)

409

  • DuplicateRequest (重复请求)

413

  • RequestTooLarge (请求体超大小限制)

415

  • UnsupportedMediaType (Content-Type不支持)

422

  • InvalidParameterValue (参数值超合法范围,如temperature超[0,2])

1.4 失败请求:本平台将状态码为 5xx 的请求和因本平台服务故障导致的用户正常请求未能到达服务器端的请求视为失败请求,但不包括以下类型的请求:

  • 由本平台发起的合理升级、变更、停机而导致的错误请求或服务不可用情况;
  • 客户的应用程序受到黑客攻击而导致被限制的请求。

1.5 每5分钟错误率:根据模型类型分别以每 5 分钟为单位按照如下方式计算:

每5分钟错误率 =(每5分钟失败请求数 / 每5分钟有效总请求数)× 100%

如果在给定的 5 分钟内,有效总请求数小于 5 ,则假定该时间段内错误率为 0。

1.6 月度服务费用:按一个自然月中客户某一溪流湖账号下万擎模型推理的模型类型分别统计月底服务费用,如果客户一次性支付了多个月份的服务费用,则将按照所购买的月数或使用量比例分摊计算月度服务费用。


二、服务可用性

2.1 服务可用性计算方式

本服务可用性按服务周期统计,根据客户某一溪流湖账号下万擎模型推理的模型类型分别统计服务可用性。服务可用性将根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用性,即:

服务可用性 =(1 - 服务周期内∑每5分钟错误率 / 服务周期5分钟总个数)× 100%

注:服务周期内5分钟总个数 = 12 × 24 × 该服务周期的天数

2.2 服务可用性承诺

本平台承诺一个服务周期内本服务的可用性不低于 99.9%。如未达到前述可用性承诺,客户可以根据本协议第 3 条约定获得赔偿。

2.3 除外情形

赔偿范围不包括因下述原因所导致的服务不可用:

  1. 本平台预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;
  2. 任何本平台所属设备以外的网络、设备故障或配置调整引起的;
  3. 客户的应用程序受到黑客攻击而引起的;
  4. 客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;
  5. 客户的疏忽或由客户授权的操作所引起的;
  6. 客户未遵循本平台产品使用文档或使用建议引起的;
  7. 用户内容违规或其他原因导致域名被封禁而产生的错误;
  8. 因客户自行引入的第三方开源软件或第三方依赖(数据库、缓存等)引起的服务不可用;
  9. 客户业务过载,由于请求超出规定配额,造成请求被控流限制引起的;
  10. 在共享资源模式下,模型推理请求的处理时间可能受到平台或上游模型服务提供方资源调度及容量限制的影响,由此产生的排队、延时增加或超时等情况,不计入服务不可用时间。
  11. 不可抗力引起的。

三、赔偿方案

3.1 赔偿标准

如本服务未达到上述可用性承诺,客户可以根据以下标准获得赔偿。赔偿将以代金券的方式发放,该等代金券不能折现、亦不得转让、赠予,仅限您通过本平台官网订购本服务使用。

该赔偿是本平台针对服务不满足服务可用性承诺向您提供的全部及唯一赔偿,且任何情形下赔偿总额不得超过未达到服务可用性承诺当月客户应支付的月度服务费用(此处的月度服务费应扣除使用代金券、优惠券、折扣优惠及服务费减免等方式而抵扣/减免的金额)。

服务可用性

赔偿代金券金额

低于 99.9% 但等于或高于 99.0%

月度服务费的 10%

低于 99.0% 但等于或高于 95.0%

月度服务费的 25%

低于 95.0%

月度服务费的 50%

3.2 赔偿申请时限

客户可以在每月第 5 个工作日后对上个月没有达到可用性承诺的推理服务提出赔偿申请。赔偿申请必须限于在本服务没有达到服务可用性的相关月份结束后 2 个月内提出。超出申请时限的赔偿申请将不被受理。

客户提出赔偿申请后,本平台会进行相应核实。对于服务月度的服务可用性的计算,若双方出现争议的,双方均同意最终以本平台的后台记录为准。

3.3 赔偿申请材料

您的赔偿申请需至少与下列信息一同提供:

  1. 您的业务使用的账号 ID;
  2. 您的业务不可用具体时间段,精确到分钟。

四、其他

4.1 责任限制

在任何情况下,若您在使用本服务过程中因本平台违约原因造成您损失的,本平台的违约赔偿总额不超过您就本服务过往 12 个月已经支付的服务费总额。

4.2 协议修改

本平台有权根据变化适时对本协议条款做出修改。如本 SLA 条款有任何修改,本平台将提前 30 天以网站公示或发送站内信的方式通知您。如您不同意协议所做的修改,您有权停止使用本服务;如您继续使用本服务,则视为您接受修改后的协议。


上一篇:订阅服务协议下一篇:-
该篇文档内容是否对您有帮助?
有帮助没帮助