logologo
logo
热门活动
HOT
产品
解决方案
客户价值
文档
支持与帮助
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
模型定制
模型研发
模型托管
模型评测
数据管理
系统管理
产品计费
API说明
常见问题
相关协议
文档中心
模型服务模型定制模型定制

模型定制


一、什么是模型定制?

通用大模型具备广泛的语言理解和生成能力,但缺乏对具体企业业务的深入了解。模型定制通过模型训练,将企业积累的专业知识注入模型,使其成为适配特定业务需求的专属模型,从而在目标场景下提供更准确、更专业的输出。


二、能解决什么问题?

启动建议:尝试如模型调参、 Prompt优化、插件调用等方法后,模型表现仍然不及预期,可通过【模型定制】来提升模型效果。

客户痛点【示例】

解决方式

通用模型不了解行业术语和业务逻辑

使用企业自有数据训练,通过【CPT】+【SFT】,让模型掌握行业知识

模型输出风格不符合品牌调性

通过【SFT】微调定制输出风格、格式和语气

模型回答质量不稳定,时好时坏,存在幻觉问题

通过【DPO】进行偏好优化,引导模型生成更准确、更可靠的回答

大模型推理成本过高

通过【蒸馏】和【量化】技术,以小模型替代大模型,大幅降低推理成本

模型部署需要高配 GPU,硬件成本高

通过【量化】压缩模型体积,降低硬件资源需求


三、核心能力

模型定制作为改进模型表现的核心策略,可以很好地提升模型在特定行业/业务的表现,对齐人类偏好,降低输出延迟。

能力

说明

模型精调

  • SFT(有监督微调):使用问答数据训练模型,使其掌握特定领域知识和回答能力
  • DPO(直接偏好优化):通过正负样本对比训练,引导模型生成更高质量的输出
  • CPT(继续预训练-建设中):通过无标注数据进行无监督继续预训练,强化或新增

模型特定能力

模型蒸馏

利用大模型生成高质量训练数据,训练轻量级小模型

模型量化

压缩模型精度和体积,降低部署资源需求和推理成本

若您想了解每个板块的具体能力,请点击标题前往对应文档。

上一篇:模型推理下一篇:模型精调
该篇文档内容是否对您有帮助?
有帮助没帮助