Coding Plan

HOT

产品

解决方案

售前咨询

快手万擎(Vanchin)

开始使用

产品介绍

模型介绍

模型服务

系统管理

产品计费

API说明

快速开始

在线推理API

文本生成API

文本生成

图片生成API

视频生成API

批量推理API

错误码说明

常见问题

文本生成

更新时间：2025-12-12 23:38:36

在线推理点对话 API

请求 URL

POST https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions

请求头

Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

请求参数

参数	类型	必填	描述
model	string	是	推理点 ID
messages	array	是	对话消息列表
temperature	float	否	采样温度，范围 0-2，默认 1
top_p	float	否	核采样参数，范围 0-1，默认 1
n	integer	否	生成回复数量，默认 1
stream	boolean	否	是否流式返回，默认 false
stop	string/array	否	停止词
max_tokens	integer	否	最大生成长度
presence_penalty	float	否	存在惩罚，范围 -2 到 2，默认 0
frequency_penalty	float	否	频率惩罚，范围 -2 到 2，默认 0

消息格式

{
    "messages": [
        {
            "role": "",
            "content": ""
        }
    ],
    "model": "",
    "stream": false,
}

响应格式

服务端处理成功的请求，响应的 HTTP 状态码均为 200。

接口调用出错后，异常返回的 HTTP 状态码为 4xx 或 5xx。

成功响应（非流式）

{
    "id": "req-71z2sj-1755282699618223575", // 请求Id，唯一标识一次请求
    "object": "chat.completion", // 对象类型，表示这是 chat completion 响应
    "created": 1741569952, // 创建该 chat completion 的 Unix 时间戳（单位为秒）
    "model": "", // 生成该 chat completion 所使用的模型名称
    "choices": [ // 模型生成的 chat completion 的候选列表（可能有多个候选回复）
        {
            "index": 0, // 该 chat completion 在候选列表中的索引，从0开始
            "message": { // 消息内容
                "role": "assistant", // 生成这条消息内容的角色类型（assistant）
                "content": "你好，我可以帮你什么？", // 模型返回的实际回复内容
                "refusal": null, // 拒绝原因（如果AI拒绝回答）
                "annotations": [] // 注释信息（额外的元数据）
            },
            "logprobs": null, // 对数概率信息（用于分析生成概率）
          	// 模型停止生成的原因
            "finish_reason": "stop" // 完成原因（stop/length/content_filter等）
        }
    ],
    "usage": { // 令牌使用统计
        "prompt_tokens": 19, // 输入提示消耗的token数
        "completion_tokens": 10, // 生成回复消耗的令牌数
        "total_tokens": 29, // 总令牌数（prompt + completion）
        "prompt_tokens_details": { // 输入令牌详细信息
            "cached_tokens": 0, // 缓存的令牌数
            "audio_tokens": 0 // 音频令牌数
        },
        "completion_tokens_details": { // 输出令牌详细信息
            "reasoning_tokens": 0, // 推理过程使用的令牌数
            "audio_tokens": 0, // 音频输出令牌数
            "accepted_prediction_tokens": 0, // 接受的预测令牌数
            "rejected_prediction_tokens": 0 // 拒绝的预测令牌数
        }
    },
    "service_tier": "default" // 服务层级（default/scale等）
}

成功响应（流式）

data: {
    "choices": [
        {
            "delta": {
                "content": "你好"
            },
            "finish_reason": null,
            "index": 0,
            "logprobs": null
        }
    ],
    "created": 1755282700,
    "event": "model_thought",
    "id": "req-71z2sj-1755282699618223575",
    "model": "qwen3-30b-a3b",
    "object": "chat.completion.chunk",
    "system_fingerprint": null,
    "usage": null
}

......

data: {
    "choices": [],
    "created": 1755283049,
    "id": "req-pg48yq-1755283048307453384",
    "model": "qwen3-30b-a3b",
    "object": "chat.completion.chunk",
    "system_fingerprint": null,
    "usage": {
        "completion_tokens": 1470,
        "completion_tokens_details": {
            "reasoning_tokens": 454
        },
        "prompt_tokens": 11,
        "total_tokens": 1481
    }
}

data: [DONE]

错误响应

{
    "ResponseMeta": {
      	// 请求ID
        "RequestId": "",
      	// 错误码
        "ErrorCode": "",
      	// 错误信息
        "ErrorMessage": ""
    }
}

该篇文档内容是否对您有帮助？

有帮助没帮助

关于我们

支持与服务

法律支持

联系我们

友情链接