万擎提供丰富多样的模型选择,集成了多种模型供您使用。您可通过模型列表了解模型相关介绍,依据教程或者API说明,便捷地将模型服务整合到自身业务当中。
模型名称 | 模型类型 | 模型简介 | 模型能力 | 上下文长度 | 最大输入Token | 最大输出Token | 模型默认限流 |
DeepSeek R1 | 文本生成 深度思考 | DeepSeek-R1 是由深度求索推出的推理大模型。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。 | 深度思考 Function Call | 128K | 96K | 16K | RPM:5000 TPM:10000000 |
DeepSeek V3 | 文本生成 | DeepSeek-V3 由 DeepSeek 开源,具备高质量预训练、可扩展的 MoE 架构(Mixture-of-Experts)、以及完整的推理和部署工具链。适合在企业、科研与开源社区中广泛应用。 | - | 64K | 56K | 8K | RPM:5000 TPM:10000000 |
Qwen2.5-7B-Instruct | 文本生成 | Qwen2.5-7B-Instruct是通义千问团队于 2024 年发布的一款开源大语言模型,属于 Qwen2.5 系列,具有约 70 亿参数。 | Function Call | 128K | 126K | 8K | RPM:5000 TPM:5000000 |
Qwen2.5-72B-Instruct | 文本生成 | Qwen2.5-72B-Instruct 是通义千问团队于 2024 年 9 月发布的一款大型语言模型,具备 720 亿参数,专为指令理解与执行优化,广泛应用于多语言处理、数学推理、代码生成等领域。 | Function Call | 128K | 126K | 8K | RPM:5000 TPM:5000000 |
Qwen3-8B | 文本生成 深度思考 | 实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力达到同规模业界SOTA水平、通用能力显著超过Qwen2.5-7B。 | 深度思考 Function Call | 128K | 126K(非思考) 96K(思考) | 8K | RPM:5000 TPM:5000000 |
Qwen3-32B | 文本生成 深度思考 | 实现思考模式和非思考模式的有效融合,可在对话中切换模式。推理能力显著超过QwQ、通用能力显著超过Qwen2.5-32B-Instruct,达到同规模业界SOTA水平。 | 深度思考 Function Call | 128K | 126K(非思考) 96K(思考) | 16K | RPM:5000 TPM:10000000 |
Qwen3-30B-A3B | 文本生成 | 一个拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型。 | 深度思考 Function Call | 128K | 126K(非思考) 96K(思考) | 16K | RPM:5000 TPM:5000000 |