

通用大模型具备广泛的语言理解和生成能力,但缺乏对具体企业业务的深入了解。模型定制通过模型训练,将企业积累的专业知识注入模型,使其成为适配特定业务需求的专属模型,从而在目标场景下提供更准确、更专业的输出。
启动建议:尝试如模型调参、 Prompt优化、插件调用等方法后,模型表现仍然不及预期,可通过【模型定制】来提升模型效果。
客户痛点【示例】 | 解决方式 |
通用模型不了解行业术语和业务逻辑 | 使用企业自有数据训练,通过【CPT】+【SFT】,让模型掌握行业知识 |
模型输出风格不符合品牌调性 | 通过【SFT】微调定制输出风格、格式和语气 |
模型回答质量不稳定,时好时坏,存在幻觉问题 | 通过【DPO】进行偏好优化,引导模型生成更准确、更可靠的回答 |
大模型推理成本过高 | 通过【蒸馏】和【量化】技术,以小模型替代大模型,大幅降低推理成本 |
模型部署需要高配 GPU,硬件成本高 | 通过【量化】压缩模型体积,降低硬件资源需求 |
模型定制作为改进模型表现的核心策略,可以很好地提升模型在特定行业/业务的表现,对齐人类偏好,降低输出延迟。
能力 | 说明 |
模型特定能力 | |
利用大模型生成高质量训练数据,训练轻量级小模型 | |
压缩模型精度和体积,降低部署资源需求和推理成本 |
若您想了解每个板块的具体能力,请点击标题前往对应文档。