logologo
logo
热门活动
HOT
产品
解决方案
客户价值
文档
支持与帮助
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
系统管理
产品计费
API说明
在线推理API
文本生成API
图片生成API
视频生成API
批量推理API
常见问题
相关协议
文档中心
API说明在线推理API文本生成API文本生成

文本生成


在线推理点对话 API

请求 URL

POST https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions

请求头

Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

请求参数

参数

类型

必填

描述

model

string

推理点 ID

messages

array

对话消息列表

temperature

float

采样温度,范围 0-2,默认 1

top_p

float

核采样参数,范围 0-1,默认 1

n

integer

生成回复数量,默认 1

stream

boolean

是否流式返回,默认 false

stop

string/array

停止词

max_tokens

integer

最大生成长度

presence_penalty

float

存在惩罚,范围 -2 到 2,默认 0

frequency_penalty

float

频率惩罚,范围 -2 到 2,默认 0

消息格式

{
"messages": [
{
"role": "",
"content": ""
}
],
"model": "",
"stream": false,
}

响应格式

服务端处理成功的请求,响应的 HTTP 状态码均为 200。

接口调用出错后,异常返回的 HTTP 状态码为 4xx 或 5xx。

成功响应(非流式)
{
"id": "req-71z2sj-1755282699618223575", // 请求Id,唯一标识一次请求
"object": "chat.completion", // 对象类型,表示这是 chat completion 响应
"created": 1741569952, // 创建该 chat completion 的 Unix 时间戳(单位为秒)
"model": "", // 生成该 chat completion 所使用的模型名称
"choices": [ // 模型生成的 chat completion 的候选列表(可能有多个候选回复)
{
"index": 0, // 该 chat completion 在候选列表中的索引,从0开始
"message": { // 消息内容
"role": "assistant", // 生成这条消息内容的角色类型(assistant)
"content": "你好,我可以帮你什么?", // 模型返回的实际回复内容
"refusal": null, // 拒绝原因(如果AI拒绝回答)
"annotations": [] // 注释信息(额外的元数据)
},
"logprobs": null, // 对数概率信息(用于分析生成概率)
// 模型停止生成的原因
"finish_reason": "stop" // 完成原因(stop/length/content_filter等)
}
],
"usage": { // 令牌使用统计
"prompt_tokens": 19, // 输入提示消耗的token数
"completion_tokens": 10, // 生成回复消耗的令牌数
"total_tokens": 29, // 总令牌数(prompt + completion)
"prompt_tokens_details": { // 输入令牌详细信息
"cached_tokens": 0, // 缓存的令牌数
"audio_tokens": 0 // 音频令牌数
},
"completion_tokens_details": { // 输出令牌详细信息
"reasoning_tokens": 0, // 推理过程使用的令牌数
"audio_tokens": 0, // 音频输出令牌数
"accepted_prediction_tokens": 0, // 接受的预测令牌数
"rejected_prediction_tokens": 0 // 拒绝的预测令牌数
}
},
"service_tier": "default" // 服务层级(default/scale等)
}
成功响应(流式)
​data: {
"choices": [
{
"delta": {
"content": "你好"
},
"finish_reason": null,
"index": 0,
"logprobs": null
}
],
"created": 1755282700,
"event": "model_thought",
"id": "req-71z2sj-1755282699618223575",
"model": "qwen3-30b-a3b",
"object": "chat.completion.chunk",
"system_fingerprint": null,
"usage": null
}

......

​data: {
"choices": [],
"created": 1755283049,
"id": "req-pg48yq-1755283048307453384",
"model": "qwen3-30b-a3b",
"object": "chat.completion.chunk",
"system_fingerprint": null,
"usage": {
"completion_tokens": 1470,
"completion_tokens_details": {
"reasoning_tokens": 454
},
"prompt_tokens": 11,
"total_tokens": 1481
}
}

data: [DONE]
错误响应
{
"ResponseMeta": {
// 请求ID
"RequestId": "",
// 错误码
"ErrorCode": "",
// 错误信息
"ErrorMessage": ""
}
}


上一篇:快速开始下一篇:文生图
该篇文档内容是否对您有帮助?
有帮助没帮助