logologo
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
系统管理
产品计费
API说明
在线推理API
文本生成API
图片生成API
视频生成API
批量推理API
常见问题
相关协议
文档中心
API说明在线推理API文本生成APIAnthropic协议

Anthropic协议


基础参数(必选)

参数名

类型

说明

model

Model

模型名称,填写万擎平台的具体模型推理点名称,如:ep-b0cx22-1111111111111111111

messages

array

输入消息数组。每个消息必须包含 role(user/assistant/system)和 content。常用示例:

[{"role": "user", "content": "Hello, Claude"}]

{"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]}

[

  {"role": "user", "content": "Hello there."},

  {"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"},

  {"role": "user", "content": "Can you explain LLMs in plain English?"},

]

[

  {"role": "user", "content": "What's the Greek name for Sun? (A) Sol (B) Helios (C) Sun"},

  {"role": "assistant", "content": "The best answer is ("},

]

max_tokens

number

生成的最大 Token 数。建议设置足够大的值以避免输出被截断。设置为 0 可在不生成响应的情况下填充提示缓存


输出控制

参数名

类型

默认值

说明

stream

boolean

false

是否使用 Server-Sent Events 流式输出。设置为 true 时,响应将分块返回

system

string 或 array

系统提示词。可以是字符串或 TextBlockParam 数组。用于指导模型行为、设定角色、注入知识等。优先级高于消息中的 system 角色

stop_sequences

array

自定义停止序列数组。当模型生成这些序列时立即停止生成。我们的模型通常会在自然完成其回合后停止,这将导致stop_reason响应"end_turn"。

如果您希望模型在遇到自定义文本字符串时停止生成,可以使用该stop_sequences参数。如果模型遇到自定义序列之一,则响应stop_reason值将为真"stop_sequence",并且响应stop_sequence值将包含匹配的停止序列。


思考推理

参数名

类型

说明

thinking

object

Claude 扩展思考(Extended Thinking)配置,开启后模型会先进行推理再生成回答,适用于复杂逻辑任务。可选值:ThinkingConfigEnabled(含 budget_tokens/type/display)、ThinkingConfigDisabled、ThinkingConfigAdaptive


工具调用(Function Calling)

参数名

类型

默认值

说明

tools

array

模型可能使用的工具的定义。

如果在 API 请求中包含这些tools工具,模型可能会返回tool_use表示模型使用这些工具的内容块。然后,您可以使用模型生成的工具输入运行这些工具,并可选择使用tool_result内容块将结果返回给模型。

工具分为两种类型:客户端工具和服务端工具。以下描述的行为适用于客户端工具。对于服务端工具,请参阅其各自的文档,因为每种工具的行为各不相同(例如,网页搜索工具)。

每个工具定义都包含:

name工具名称。

description:工具描述(可选,但强烈建议添加)。

input_schema:模型将在输出内容块中生成的工具形状的JSON 模式。

tool_choice

object

auto

模型应如何使用提供的工具。模型可以使用特定工具、任何可用工具、自行决定,或者完全不使用任何工具。

ToolChoiceAuto = object { type , disable_parallel_tool_use }该模型将自动决定是否使用工具。

ToolChoiceAny = object { type , disable_parallel_tool_use }该模型将使用所有可用的工具。

ToolChoiceTool = object { name , type , disable_parallel_tool_use }该模型将使用指定的工具tool_choice.name。

ToolChoiceNone = object { type }该模型将不允许使用工具。


其他参数

参数名

类型

默认值

说明

metadata

object

请求元数据。可包含 user_id 用于追踪请求,不超过 64KB。用于日志、计费、分析等用途

cache_control

object

顶层缓存控制。包含 type: "ephemeral" 和可选的 ttl(过期时间,支持 "5min" 或 "1h")。设置后可减少重复请求的延迟和成本

container

string

用于跨请求重复使用的容器标识符

inference_geo

string

推理地理区域。若不指定则使用工作区的 default_inference_geo。用于控制推理延迟和合规要求

output_config

object

输出格式配置。包含 effort(生成努力程度 low/medium/high)和 format(如 json)属性。推荐用于替代已废弃的 temperature 参数

service_tier

string

auto

服务层级:auto 自动选择优先容量(如有);standard_only 仅使用标准容量。优先容量需额外付费


上一篇:Responses API 协议下一篇:文生图
该篇文档内容是否对您有帮助?
有帮助没帮助