本文用于引导新用户如何注册账号、实名认证、开通快手万擎服务、使用平台服务等基本操作,平台接入流程示意图如下:
新用户注册后,可领取免费推理资源包;若需充值,请前往:充值汇款。若您想了解平台计费规则详情,请点击:产品计费帮助页面。
用户可根据业务情况选择在线推理或批量推理:
对比维度 | 在线推理 | 批量推理 |
数据处理方式 | 实时响应用户请求,即时返回预测结果。 | 批量处理历史或预先收集的数据,非实时输出结果。 |
时效性 | 需在毫秒级到秒级内返回结果,延迟直接影响用户体验或业务决策。 | 按预定周期处理,可接受较长处理时间,不要求实时响应。 |
数据规模 | 单条或小批量数据。 | 大规模数据集(如TB级日志)。 |
资源利用 | 持续占用资源,提供高并发服务。 | 弹性调度资源,可错峰运行。 |
适用场景 |
... |
... |
体验入口 |
点击「新建推理服务」,填写推理点名称、模型等信息并完成确认,提交成功后将自动跳转至推理点详情-API 调用页面。
用户在推理点详情-API 调用页面可查看该推理点的API调用方式及推理点基本信息。API调用页面可以查看模型推理接入点的调用方法,点击「查看API Key」获取API Key,在环境变量中进行设置,参考API示例对模型推理接入点进行调用。
推理点详情-基本信息页面可查看选中推理点的名称、标签、描述、接入模型、接入点限流情况,点击「编辑」按钮可修改该接入点的名称、标签及描述。
若当前项目下存在多个推理接入点时,用户可在「在线推理」列表页面查看该项目下的所有推理点信息,包括接入点名称、状态、模型服务、限流情况、标签等信息。该页面支持通过接入点名称/ID、描述进行搜索。用户在该页面可对选中的推理点进行API调用、查看调用统计情况、进入模型体验页面等。
点击「新建批量推理点」进入信息填写页面,填写推理点名称、模型等信息并完成确认,提交成功后将自动跳转至推理点详情-API 调用页面。
用户在批量推理点详情-API 调用页面可查看该推理点的API调用方式及推理点基本信息。API调用页面可以查看模型推理接入点的调用方法,点击「查看API Key」获取API Key,在环境变量中进行设置,参考API示例对模型推理接入点进行调用。
批量推理点详情-基本信息页面可查看选中推理点的名称、标签、描述、接入模型、模型限额,点击「编辑」按钮可修改该接入点的名称、标签及描述。
当某个项目下存在多个批量推理接入点时,用户可在批量推理列表页面查看该项目下的所有推理点信息,包括批量推理点名称、状态、模型服务、标签等信息。该页面支持通过接入点名称/ID、描述进行搜索。用户在该页面可对选中的推理点进行API调用、查看调用统计情况、进入模型体验页面等操作。
点击「新建批量推理任务」进入信息填写页面,用户需填写批量推理任务名称、接入模型、上传数据文件并完成确认,提交成功后将自动跳转至批量推理-任务详情页面。
用户在批量推理任务详情页面可查看选中批量推理任务的名称、标签、描述、任务开始时间及接入配置等信息,点击「编辑」按钮可修改该接入点的名称、标签及描述。任务执行成功/异常/结果文件过期提醒将通过短信方式告知用户。
当某个项目下存在多个批量推理任务时,用户可在批量推理列表页面查看该项目下的所有推理任务信息,包括批量推理任务名称、状态、任务进度、模型服务、标签等信息。该页面支持通过接入点名称/ID、描述进行搜索。用户在该页面可对选中的批量推理任务进行查看任务处理结果、查看调用统计情况、终止执行任务等操作。