热门活动

HOT

产品

解决方案

售前咨询

快手万擎(Vanchin)

开始使用

产品介绍

模型介绍

模型服务

GPU算力服务

系统管理

产品计费

API说明

快速开始

在线推理API

文本生成API

图片生成API

视频生成API

批量推理API

用量查询API

错误码说明

常见问题

Anthropic协议

更新时间：2026-06-09 19:35:58

基础参数（必选）

参数名

类型

说明

model

Model

模型名称，填写万擎平台的具体模型推理点名称，如：ep-b0cx22-1111111111111111111

messages

array

输入消息数组。每个消息必须包含 role（user/assistant/system）和 content。常用示例：

[{"role": "user", "content": "Hello, Claude"}]

{"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]}

[

{"role": "user", "content": "Hello there."},

{"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"},

{"role": "user", "content": "Can you explain LLMs in plain English?"},

]

[

{"role": "user", "content": "What's the Greek name for Sun? (A) Sol (B) Helios (C) Sun"},

{"role": "assistant", "content": "The best answer is ("},

]

max_tokens

number

生成的最大 Token 数。建议设置足够大的值以避免输出被截断。设置为 0 可在不生成响应的情况下填充提示缓存

输出控制

参数名

类型

默认值

说明

stream

boolean

false

是否使用 Server-Sent Events 流式输出。设置为 true 时，响应将分块返回

system

string 或 array

—

系统提示词。可以是字符串或 TextBlockParam 数组。用于指导模型行为、设定角色、注入知识等。优先级高于消息中的 system 角色

stop_sequences

array

—

自定义停止序列数组。当模型生成这些序列时立即停止生成。我们的模型通常会在自然完成其回合后停止，这将导致stop_reason响应"end_turn"。

如果您希望模型在遇到自定义文本字符串时停止生成，可以使用该stop_sequences参数。如果模型遇到自定义序列之一，则响应stop_reason值将为真"stop_sequence"，并且响应stop_sequence值将包含匹配的停止序列。

思考推理

参数名	类型	说明
thinking	object	Claude 扩展思考（Extended Thinking）配置，开启后模型会先进行推理再生成回答，适用于复杂逻辑任务。可选值：ThinkingConfigEnabled（含 budget_tokens/type/display）、ThinkingConfigDisabled、ThinkingConfigAdaptive

工具调用（Function Calling）

参数名

类型

默认值

说明

tools

array

—

模型可能使用的工具的定义。

如果在 API 请求中包含这些tools工具，模型可能会返回tool_use表示模型使用这些工具的内容块。然后，您可以使用模型生成的工具输入运行这些工具，并可选择使用tool_result内容块将结果返回给模型。

工具分为两种类型：客户端工具和服务端工具。以下描述的行为适用于客户端工具。对于服务端工具，请参阅其各自的文档，因为每种工具的行为各不相同（例如，网页搜索工具）。

每个工具定义都包含：

name工具名称。

description：工具描述（可选，但强烈建议添加）。

input_schema：模型将在输出内容块中生成的工具形状的JSON 模式。

tool_choice

object

auto

模型应如何使用提供的工具。模型可以使用特定工具、任何可用工具、自行决定，或者完全不使用任何工具。

ToolChoiceAuto = object { type , disable_parallel_tool_use }该模型将自动决定是否使用工具。

ToolChoiceAny = object { type , disable_parallel_tool_use }该模型将使用所有可用的工具。

ToolChoiceTool = object { name , type , disable_parallel_tool_use }该模型将使用指定的工具tool_choice.name。

ToolChoiceNone = object { type }该模型将不允许使用工具。

其他参数

参数名	类型	默认值	说明
metadata	object	—	请求元数据。可包含 user_id 用于追踪请求，不超过 64KB。用于日志、计费、分析等用途
cache_control	object	—	顶层缓存控制。包含 type: "ephemeral" 和可选的 ttl（过期时间，支持 "5min" 或 "1h"）。设置后可减少重复请求的延迟和成本
container	string	—	用于跨请求重复使用的容器标识符
inference_geo	string	—	推理地理区域。若不指定则使用工作区的 default_inference_geo。用于控制推理延迟和合规要求
output_config	object	—	输出格式配置。包含 effort（生成努力程度 low/medium/high）和 format（如 json）属性。推荐用于替代已废弃的 temperature 参数
service_tier	string	auto	服务层级：auto 自动选择优先容量（如有）；standard_only 仅使用标准容量。优先容量需额外付费

上一篇：Responses API 协议下一篇：文生图

该篇文档内容是否对您有帮助？

有帮助没帮助

关于我们

支持与服务

法律支持

联系我们

友情链接