logologo
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
产品公告
活动公告
产品计费
API说明
控制台介绍
常见问题
相关协议
文档中心
产品介绍产品公告模型发布公告

模型发布公告


本文介绍了快手万擎大模型服务平台的大模型发布记录,欢迎用户前来体验,如有问题可联系平台客服。若需API调用,可参考:API 调用指南

发布时间:2025年10月

更新时间

模型名称

模型版本

模型类型

模型介绍

10月29日

Qwen3-VL-235B-A22B-Instruct

Qwen3-VL-235B-A22B-Instruct

多模态

Qwen3系列视觉理解模型,在视觉coding、空间感知等方向全面升级;视觉感知与识别能力大幅提升,支持超长视频理解,OCR能力迎来重大升级。

10月29日

Qwen3-VL-235B-A22B-Thinking

Qwen3-VL-235B-A22B-Thinking

多模态

Qwen3系列视觉理解模型,多模态思考能力显著增强,模型在STEM与数学推理方面进行了重点优化;视觉感知与识别能力全面提升、OCR能力迎来重大升级。

10月23日

KAT-Coder-Pro

KAT-Coder-Pro-V1

文本生成

专为 Agentic Coding 设计,全面覆盖编程任务与场景,通过大规模智能体强化学习,实现智能行为涌现,在代码编写性能上显著超越同类模型。

10月23日

KAT-Coder-Exp-72B

KAT-Coder-Exp-72B-1010

文本生成

KAT-Coder-Exp-72B 是 KAT-Coder 系列模型中的 RL 创新实验版本,在软件开发能力评测基准 SWE-Bench verified 上取得了 74.6% 的卓越性能,创下开源模型新纪录。专注于 Agentic Coding,目前仅支持 SWE-Agent 脚手架,也可进行简单对话。

10月23日

KAT-Coder-Air

KAT-Coder-Air-V1

文本生成

KAT-Coder 系列模型中的轻量化版本。专为 Agentic Coding 设计,全面覆盖编程任务与场景,通过大规模智能体强化学习,实现智能行为涌现,在代码编写性能上显著超越同类模型。

10月17日

Qwen3-235B-A22B

Qwen3-235B-A22B-Thinking-2507

文本生成

在数学、代码和逻辑推理等评测中,显著超过 QwQ 和同尺寸的非推理模型,达到同规模业界顶尖水平。创意写作、角色扮演、多轮对话、指令遵循能力均大幅提升,通用能力显著超过同尺寸模型。在推理、非推理两种模式下都达到业界领先水平,能精准调用外部工具。支持100多种语言和方言,多语言翻译、指令理解、常识推理能力都明显提升。

10月11日

KAT-Dev-72B-Exp(已下线)

KAT-Dev-72B-Exp

文本生成

KAT-Dev-72B-Exp 是KAT-Coder模型强化学习的实验版本,在软件开发能力评测基准 SWE-Bench verified 上取得了 74.6% 的卓越性能,创下开源模型新纪录。专注于Agentic Coding,目前仅支持SWE-Agent脚手架,也可进行简单对话。

10月11日

DeepSeek-V3.2-Exp

DeepSeek-V3.2-Exp

文本生成

深度思考

DeepSeek-V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。

发布时间:2025年9月

更新时间

模型名称

模型版本

模型类型

模型介绍

9月19日

KAT-Coder(已下线)

KAT-Coder

文本生成

KAT-Coder 是 KAT 系列中的最强模型,具备专家级的编程能力,能够高效完成功能开发、缺陷分析、单测生成等任务。

9月9日

DeepSeek V3.1

DeepSeek V3.1

文本生成

深度思考

DeepSeek-V3.1 采用混合推理架构,可同时支持思考模式与非思考模式,用户可通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 显著提升了思考效率,能够在更短时间内提供高质量答案。此外,通过 Post-Training 优化,模型在工具使用与智能体任务中的表现大幅增强。

9月9日

DeepSeek V3

DeepSeek V3

文本生成

DeepSeek-V3 由 DeepSeek 开源,具备高质量预训练、可扩展的 MoE 架构(Mixture-of-Experts)、以及完整的推理和部署工具链。适合在企业、科研与开源社区中广泛应用。

9月2日

Kimi-K2

Kimi-K2-Instruct

文本生成

Kimi-K2是一款先进的混合专家(MoE)语言模型,拥有320亿个激活参数和1万亿个总参数。Kimi K2采用Muon优化器进行训练,在前沿知识、推理和编码任务中表现出色,同时针对代理能力进行了精心优化。

发布时间:2025年8月

更新时间

模型名称

模型版本

模型类型

模型介绍

8月15日

DeepSeek-R1

DeepSeek-R1

文本生成

深度思考

DeepSeek-R1 是由深度求索推出的推理大模型。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

8月15日

Qwen2.5-7B

Qwen2.5-7B-Instruct

文本生成

Qwen2.5-7B-Instruct 是通义千问团队于2024年发布的一款开源大语言模型,属于 Qwen2.5 系列,具有约70亿参数。

8月15日

Qwen3-8B

Qwen3-8B

文本生成

深度思考

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界 SOTA 水平、通用能力显著超过 Qwen2.5-7B。

8月15日

Qwen3-32B

Qwen3-32B

文本生成

深度思考

实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过 QwQ、通用能力显著超过 Qwen2.5-32B-Instruct,达到同规模业界 SOTA 水平。

8月15日

Qwen3-30B-A3B

Qwen3-30B-A3B

文本生成

一个拥有约300亿总参数和30亿激活参数的小型 MoE 模型。

上一篇:产品更新公告下一篇:KAT-Coder-Pro V1 更新日志
该篇文档内容是否对您有帮助?
有帮助没帮助