

参数名 | 类型 | 说明 |
|---|---|---|
model | Model | 模型名称,填写万擎平台的具体模型推理点名称,如:ep-b0cx22-1111111111111111111 |
messages | array | 输入消息数组。每个消息必须包含 role(user/assistant/system)和 content。常用示例: [{"role": "user", "content": "Hello, Claude"}] {"role": "user", "content": [{"type": "text", "text": "Hello, Claude"}]} [ {"role": "user", "content": "Hello there."}, {"role": "assistant", "content": "Hi, I'm Claude. How can I help you?"}, {"role": "user", "content": "Can you explain LLMs in plain English?"}, ] [ {"role": "user", "content": "What's the Greek name for Sun? (A) Sol (B) Helios (C) Sun"}, {"role": "assistant", "content": "The best answer is ("}, ] |
max_tokens | number | 生成的最大 Token 数。建议设置足够大的值以避免输出被截断。设置为 0 可在不生成响应的情况下填充提示缓存 |
参数名 | 类型 | 默认值 | 说明 |
|---|---|---|---|
stream | boolean | false | 是否使用 Server-Sent Events 流式输出。设置为 true 时,响应将分块返回 |
system | string 或 array | — | 系统提示词。可以是字符串或 TextBlockParam 数组。用于指导模型行为、设定角色、注入知识等。优先级高于消息中的 system 角色 |
stop_sequences | array | — | 自定义停止序列数组。当模型生成这些序列时立即停止生成。我们的模型通常会在自然完成其回合后停止,这将导致stop_reason响应"end_turn"。 如果您希望模型在遇到自定义文本字符串时停止生成,可以使用该stop_sequences参数。如果模型遇到自定义序列之一,则响应stop_reason值将为真"stop_sequence",并且响应stop_sequence值将包含匹配的停止序列。 |
参数名 | 类型 | 说明 |
|---|---|---|
thinking | object | Claude 扩展思考(Extended Thinking)配置,开启后模型会先进行推理再生成回答,适用于复杂逻辑任务。可选值:ThinkingConfigEnabled(含 budget_tokens/type/display)、ThinkingConfigDisabled、ThinkingConfigAdaptive |
参数名 | 类型 | 默认值 | 说明 |
|---|---|---|---|
tools | array | — | 模型可能使用的工具的定义。 如果在 API 请求中包含这些tools工具,模型可能会返回tool_use表示模型使用这些工具的内容块。然后,您可以使用模型生成的工具输入运行这些工具,并可选择使用tool_result内容块将结果返回给模型。 工具分为两种类型:客户端工具和服务端工具。以下描述的行为适用于客户端工具。对于服务端工具,请参阅其各自的文档,因为每种工具的行为各不相同(例如,网页搜索工具)。 每个工具定义都包含: name工具名称。 description:工具描述(可选,但强烈建议添加)。 input_schema:模型将在输出内容块中生成的工具形状的JSON 模式。 |
tool_choice | object | auto | 模型应如何使用提供的工具。模型可以使用特定工具、任何可用工具、自行决定,或者完全不使用任何工具。 ToolChoiceAuto = object { type , disable_parallel_tool_use }该模型将自动决定是否使用工具。 ToolChoiceAny = object { type , disable_parallel_tool_use }该模型将使用所有可用的工具。 ToolChoiceTool = object { name , type , disable_parallel_tool_use }该模型将使用指定的工具tool_choice.name。 ToolChoiceNone = object { type }该模型将不允许使用工具。 |
参数名 | 类型 | 默认值 | 说明 |
|---|---|---|---|
metadata | object | — | 请求元数据。可包含 user_id 用于追踪请求,不超过 64KB。用于日志、计费、分析等用途 |
cache_control | object | — | 顶层缓存控制。包含 type: "ephemeral" 和可选的 ttl(过期时间,支持 "5min" 或 "1h")。设置后可减少重复请求的延迟和成本 |
container | string | — | 用于跨请求重复使用的容器标识符 |
inference_geo | string | — | 推理地理区域。若不指定则使用工作区的 default_inference_geo。用于控制推理延迟和合规要求 |
output_config | object | — | 输出格式配置。包含 effort(生成努力程度 low/medium/high)和 format(如 json)属性。推荐用于替代已废弃的 temperature 参数 |
service_tier | string | auto | 服务层级:auto 自动选择优先容量(如有);standard_only 仅使用标准容量。优先容量需额外付费 |