logologo
售前咨询
快手万擎(Vanchin)
文档中心
产品介绍活动公告快手探索者 LLM-Rec 挑战赛 · 万擎平台介绍

快手探索者 LLM-Rec 挑战赛 · 万擎平台介绍


一、平台简介

万擎平台作为本次赛事的官方算力与训练支持平台,为参赛选手提供数据管理、模型训练与开发调试等全流程能力支持。

快手万擎是企业级模型服务与AI算力云平台,集成高性能模型推理、低成本模型定制与全托管服务,助力企业专注于AI应用创新,无需担忧底层算力的复杂性与成本。


二、能力速览

📌 提示:本文档所述平台能力及竞赛专属资源将于赛事正式开始后开放,具体时间以比赛官网为准。

万擎平台为本次比赛开放以下四项核心能力,覆盖从数据准备、模型训练、模型管理到竞赛评测的完整参赛链路:

2.1 数据集

数据集是平台上模型训练和评测的数据基础,支持选手将自有训练数据上传至平台进行统一管理。平台会对上传数据自动进行格式校验,并支持多版本迭代管理,方便选手在不同数据配比方案之间灵活切换与对比。平台还为选手预置了官方专项数据集,可直接在精调任务中调用。

选手可通过数据集模块实现以下操作:

  • 上传训练数据:支持 JSONL、CSV、XLSX 等常见格式,平台将自动校验数据格式;
  • 多版本管理:对同一数据集进行多版本迭代,方便对比不同数据配比下的训练效果;
  • 数据集选用:平台内置本次比赛的专项数据集,选手可直接调用。


2.2 模型训练

平台为选手提供模型精调与开发机两种训练方式,本次竞赛推荐选手优先采用模型定制-精调,精调流程针对本次竞赛场景进行了专项适配:

  • 更灵活——可自由配置数据集权重、自定义训练函数监控指标,满足不同调优策略的实验需求;
  • 更高效——训练任务由平台全托管调度,完成后模型自动归档并直连竞赛评测入口,无需手动导出与上传,显著缩短单轮迭代周期。

2.2.1 模型定制-精调

模型精调是指基于特定数据集对基础模型进行进一步训练,使其在目标任务上达到更优效果。通过 SFT(有监督精调)方式,让模型在高质量标注数据上学习,使其掌握推荐场景下的知识与回答规范。

选手可通过模型精调模块实现以下操作:

  • 训练方法选择:支持 LoRA 和全量更新两种训练方法,LoRA 训练速度快、资源消耗低,适合快速验证方向;全量更新调优上限更高,适合精细调参;
  • 超参数配置:训练超参数对模型的收敛速度与最终效果有直接影响。平台支持灵活配置迭代轮次、学习率、批大小等参数,选手可根据自身训练策略自由调整,精准控制训练过程;
  • 数据配置:支持同时选择多个数据集进行混合训练,灵活组合官方预置数据集与自有数据;可从训练集中随机拆分验证集,或单独指定验证数据集,用于训练过程中的效果评估;
  • 过程可视化:预置 training_loss、eval_loss 等常用指标,并支持选手灵活添加自定义监控指标;多任务曲线可叠加对比展示,便于横向评估不同方案的收敛效果;
  • 模型发布与管理:训练完成后模型将发布至仓库,支持多 Checkpoint 版本管理,确认效果后可直接提交竞赛评测。

2.2.2 模型研发-开发机

开发机是平台提供的在线交互式开发环境,相当于一台配备了 GPU、开箱即用的云服务器。选手可在浏览器中直接打开 VS Code 或 Terminal,在上面编写、调试和运行训练脚本,无需在本地配置任何环境。

选手可通过开发机模块实现以下操作:

  • 在线编码调试:平台提供云端 VS Code 和 Terminal,无需本地搭建环境,即刻开始开发;
  • 预置开发镜像:提供 PyTorch、ms-swift 等常用框架的预置镜像,免去环境配置,开机即可训练;
  • 持久化存储:支持挂载共享存储,确保数据和模型文件不会因开发机关机而丢失;
  • 模型导出与上传:训练完成后,将模型文件下载至本地,再上传至平台模型仓库,即可通过仓库发起竞赛评测。


2.3 模型仓库

模型仓库是训练产出模型的统一管理中心,精调任务产出模型及通过开发机训练后上传的模型均归档至此。选手可在仓库对模型进行版本管理及提交评测等操作。

选手可通过模型仓库实现以下操作:

  • 自动归档:精调任务完成后模型自动写入仓库,无需手动导出,可查看模型名称、版本、基础模型、来源任务等信息;
  • 上传自定义模型:支持从本地或在线存储上传模型文件(支持 .safetensors、.json、.yaml 等格式),也支持通过 ModelScope / HuggingFace 链接导入;
  • 版本管理:同一模型支持多个 Checkpoint 版本并存,便于对比不同训练阶段的模型效果。

⚠️ 注意:每支参赛队伍的仓库存储空间有上限,仓库容量不足时请及时清理不再使用的旧版本模型。


2.4 竞赛评测

竞赛评测是本次比赛的专属提交入口,提交后平台将自动调用 OneRec Benchmark 评测集对模型进行打分,无需选手自行部署模型或编写评测脚本,结果出来后可直接查看各维度得分并与排行榜对照。

选手可通过竞赛评测模块实现以下操作:

  • 调试评测:支持提交调试评测任务,结果不计入排行榜,可用于在正式提交前验证模型效果;
  • 正式评测:选择已完成训练的模型,一键提交至官方评测集进行打分,结果自动计入排行榜;
  • 查看分层结果:评测完成后可查看 L0(感知)/ L1(推导)/ L2(演进)/ L3(推荐)各维度得分,帮助选手定位模型能力瓶颈,指导下一轮精调方向。

⚠️ 注意:正式评测每日限提交 3 次,调试评测每日限提交 10 次,请合理规划提交时机。


三、登录指南

📌 本次比赛请认定万擎平台唯一站点:https://www.streamlake.com/product/wanqing

3.1 实名认证

  • 使用队长赛事报名时注册的账号登录万擎官网,将鼠标移至右上角用户头像,进入「账号中心」点击「实名认证」。选择「个人实名认证」并提交认证信息:
    • 个人实名支持扫脸认证,可即时通过
    • 个人身份证认证需审核1-3个工作日,请耐心等待
  • 认证完成后,进入「控制台」即可开通快手万擎业务。


3.2 团队账号使用

平台支持同一账号多终端同时登录,推荐团队共用队长注册账号,参赛资源也将统一发放至队长账号中。

如在平台使用过程中遇到问题,可通过比赛官方社群获取技术支持。


四、参赛资源

「LLM-Rec挑战赛」初赛补给包

「LLM-Rec挑战赛」复赛资源包

领取资格

LLM-Rec 初赛报名后,通过“高校身份认证”审核的账号

由LLM-Rec 初赛晋级复赛的50支参赛队伍

资源约束

限量免费资源:模型精调150份/模型研发50份,每个账号可二选一:

  • 模型定制:限量发放比赛模型专属精调代金券1500元
  • 模型研发:限量发放比赛专属代金券1500元

如超出代金券额度,将产生扣费

由快手万擎官方依据各晋级参赛队伍向赛会提交的资源类型直接下发至参赛账号:

  • 模型定制:比赛模型专属精调代金券10000元

  • 模型研发:固定卡型(H800 / 四卡) 专属代金券10000元

如超出代金券额度,将产生扣费

资源有效期

2026年7月1日至7月31日

2026年8月3日至9月30日

备注

平台发放的资源不仅可用于竞赛涉及的「模型精调」及「开发机」能力,也可用于「模型蒸馏」、「模型量化」及「自定义任务」等功能,欢迎选手们前往平台体验。

上一篇:“快手万擎千万Tokens免费体验”活动规则下一篇:KAT-Coder-Air V1 模型免费使用规则
该篇文档内容是否对您有帮助?
有帮助没帮助