logologo
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
产品计费
API说明
控制台介绍
常见问题
相关协议
文档中心
模型介绍模型能力

模型能力


一、文本生成

文本生成模型基于前沿大语言模型技术,具备强大的语言理解与生成能力,能够根据用户输入的提示词(Prompt)——无论是关键词、一句话指令,还是包含上下文的复杂任务描述——自动生成逻辑严谨、语义连贯、风格适配的高质量自然语言文本。

核心能力

基础能力

  • 多场景文本生成

支持新闻报道、商品文案、短视频脚本、法律合同、技术文档、诗歌小说等多种文体,满足内容创作、营销、办公、教育等多样化需求。

  • 深度语义理解与多轮对话

精准解析用户意图,支持上下文感知的多轮对话管理,确保交互连贯、响应准确,为智能客服、虚拟助手等应用提供坚实基础。

  • 跨领域知识问答

覆盖科学、技术、文化、历史、金融等广泛知识领域,提供事实准确、表述清晰的答案,助力知识检索与决策支持。

  • 全栈代码辅助

支持 Python、Java、C++、JavaScript 等主流编程语言,可完成代码生成、注释解释、错误调试、算法优化等任务,成为开发者的高效协作者。

进阶特性

  • 超长上下文支持

超长上下文窗口帮助您轻松处理长篇文档摘要、复杂技术方案撰写、多轮深度对话等高难度任务。

  • 精准指令跟随

能够理解并执行结构化指令,如“以 JSON 格式输出分析结果”,实现从自然语言到结构化输出的无缝转换。

  • 灵活风格控制

通过系统提示词(System Prompt)动态调整输出风格,自由切换学术严谨、口语亲切、诗意浪漫等表达方式,贴合不同受众与场景。

使用方式

示例如下:http请求

curl 'https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions' \
-H "Authorization: Bearer $WQ_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "模型 id/推理点 id",
"messages": [
{
"role": "system",
"content": "你是一个 AI 人工智能助手。"
},
{
"role": "user",
"content": "请介绍一下太阳系的八大行星"
}
]
}'

sdk方式请求

import os
from openai import OpenAI

# 请确保您已将 API Key 存储在环境变量 WQ_API_KEY
# 初始化 OpenAI 客户端,从环境变量中读取您的 API Key
client = OpenAI(
# 此为默认路径,您可根据业务所在地域进行配置
base_url="https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints",
# 从环境变量中获取您的 API Key
api_key=os.environ.get("WQ_API_KEY")
)

# Single-round:
print("----- standard request -----")
completion = client.chat.completions.create(
model="模型 id/推理点 id",
messages=[
{"role": "system", "content": "你是一个 AI 人工智能助手"},
{"role": "user", "content": "请介绍一下太阳系的八大行星"},
],
)
print(completion.choices[0].message.content)

消息结构说明

在通过 API 与大语言模型进行对话式交互时,输入和输出以消息(Message)的形式组织。每条消息包含两个核心字段:角色(role)和内容(content)。其中,角色(role)用于标识消息的来源或用途,通常包括system、user和assistant。

角色

描述

system

系统消息,用于设定对话的全局行为、身份、风格或约束(例如:“你是一位专业的技术支持工程师”)。该消息对用户不可见,但会影响模型的整体响应方式。

user

用户消息,代表用户输入的指令、问题或上下文。

assistant

助手消息,表示模型生成的回复内容。

在多轮对话中,这些消息角色可以组合使用,以实现复杂的上下文管理。

适用模型参见 模型列表


二、深度思考

深度思考模型是在传统大语言模型基础上,专为复杂推理任务强化设计的新一代 AI 推理引擎。它不仅具备强大的语言生成能力,更通过结构化思维、知识融合与自修正机制,显著提升在逻辑分析、数理计算、代码生成和多步决策等高难度场景中的准确性与可靠性。

核心能力

  • 多结构化推理

模型在生成最终答案前,会先输出一段清晰的思维链(Chain-of-Thought),逐步拆解问题、推演逻辑、验证中间结果,使推理过程透明、可追溯,大幅降低“幻觉”风险。

  • 强逻辑与数值计算能力

针对数学解题、算法设计、公式推导等任务进行专项优化,支持精确的数值运算与符号推理,超越普通语言模型的“猜测式回答”。

  • 知识深度融合

有效结合领域知识库、编程规范与常识推理,在技术问答、工程调试、科研辅助等场景中提供专业级响应。

  • 自修正与反馈闭环

部分先进实现支持对中间结果的自我验证与迭代修正,通过“生成—评估—优化”循环不断提升输出质量。

使用方式

调用深度思考模型API示例

curl 'https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions' \
-H "Authorization: Bearer $WQ_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "模型 id/推理点 id",
"messages": [
{
"role": "system",
"content": "你是一个 AI 人工智能助手。"
},
{
"role": "user",
"content": "请介绍一下太阳系的八大行星"
}
],
"enable_thinking":true // 表示开启深度思考
}'

主要参数说明

  • enable_thinking:控制模型是否开启思考模式

使用方式:部分深度思考模型通过enable_thinking参数控制是否开启思考,默认为false,表示关闭深度思考。如果要开启深度思考,设置为true。

适用模型参见 模型列表


三、多模态

平台提供支持图片与视频理解的多模态大模型,支持接收用户上传的图片或视频,并结合文本指令进行内容理解与智能问答。相比纯文本模型,这类多模态模型能够处理图文融合任务,适用于图像描述、视觉问答、视频摘要等场景。

核心能力

图像理解

  • 图像描述(Image Captioning)

自动生成对图像内容的自然语言描述,涵盖主体对象、场景、动作和氛围等关键信息。例如,输入一张街景照片,模型可输出:“一个阳光明媚的下午,行人走在林荫道上,路边有咖啡馆和自行车。”

  • 视觉问答(VQA)

根据用户提出的关于图像的问题,结合视觉内容进行精准回答。例如,提问“图中有几只猫?”,模型会识别并返回数量及位置信息。

  • OCR 文字识别与语义理解

不仅能从图像中提取文字(如截图、票据、文档),还能理解文字的语义上下文,实现结构化解析。例如,识别发票后自动提取“金额”“开票日期”“销售方”等字段。

  • 物体检测与定位

识别图像中多个目标物体,并提供其类别、位置(如边界框坐标)及相互关系。适用于安防监控、零售货架分析、自动驾驶感知等场景。

  • 图像分类与场景分析

判断图像所属的类别(如“室内/室外”“医疗影像/自然风景”)并分析整体场景语义,支持细粒度分类(如“狗的品种”“服装风格”)。

视频理解

  • 视频摘要与关键帧提取

自动提炼视频的核心内容,生成文字摘要,并识别最具代表性的关键帧,用于快速浏览或内容索引。

  • 动作识别与事件理解

识别视频中人物或物体的动作(如“跑步”“跌倒”“开门”)及复合事件(如“顾客进店后拿起商品”),适用于行为分析、体育判罚、工业操作合规检测等。

  • 基于视频内容的问答

支持用户针对视频内容提问,模型结合时序信息进行推理回答。例如:“视频中穿红衣服的人什么时候离开画面?”、“发生了几次碰撞?”

使用方式

图像理解

图像URL输入

curl 'https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions' \
-H "Authorization: Bearer $WQ_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "模型 id/推理点 id",
"messages": [
{
"role": "user",
"content": [
{"type": "text","text": "这是什么"},
{"type": "image_url","image_url": {"url": "图片 URL 链接"}}
]
}
]
}'

图像格式说明

模型支持的图像格式如下,请根据实际的图像格式,匹配输入的文件后缀。当您传入本地图像时,请将代码中的image/{format}设置为对应的 Content Type值。

图片格式

文件扩展名

Content Type

JPEG

.jpg, .jpeg

image/jpeg

PNG

.png

image/png

BMP

.bmp

image/bmp

视频理解

视频URL输入

curl 'https://wanqing.streamlakeapi.com/api/gateway/v1/endpoints/chat/completions' \
-H "Authorization: Bearer $WQ_API_KEY" \
-H 'Content-Type: application/json' \
-d '{
"model": "模型 id/推理点 id",
"messages": [
{
"role": "user",
"content": [
{"type": "video_url","video_url": {"url": "视频 URL 链接"}},
{"type": "text","text": "这段视频的内容是什么?"}
]
}
]
}'

视频格式支持说明

支持MP4、AVI、MOV三种类型格式视频文件。

  • MP4:base64格式为video/mp4
  • AVI:base64格式为video/avi
  • MOV:base64格式为video/quicktime

适用模型参见 模型列表

上一篇:模型列表下一篇:功能特性
该篇文档内容是否对您有帮助?
有帮助没帮助