logologo
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
模型定制
模型研发
模型托管
模型评测
数据管理
系统管理
产品计费
API说明
常见问题
相关协议
文档中心
模型服务模型研发开发机

开发机


开发机是万擎为用户提供的在线交互式开发环境,专为 AI 模型研发场景设计,致力于为用户提供“开箱即用”的云端开发体验。通过封装标准化的开发环境配置流程,开发机彻底免去了用户本地搭建、调试开发环境的繁琐操作,同时实现代码管理与开发环境管理的一体化,让用户能够聚焦模型研发核心任务。

一、核心能力

  • 高效开发:为用户提供云端AI开发IDE,当前支持VSCode及Terminal。
  • GPU资源:支持A10、4090、L20、X40等型号,可根据模型研发需求灵活选择适配的算力资源。
  • 共享存储:支持挂载分布式文件存储服务,实现云端开发机与远端存储的无缝对接。
  • 预置镜像:平台提供六大类预置镜像,满足用户不同开发场景,包括isaac-sim、cudagl、python、pytorch、verl及ms-swift。

二、适用场景

核心适配:模型研发初期的轻量开发、即时调试、效果验证,无需大规模算力,侧重“便捷性、即时性、可视化”。

  • 在线调试验证

在IDE(当前支持VSCode和Terminal)中更加方便快捷地修改模型架构、损失函数、优化器参数,训练数个Epoch并实时观察损失曲线与验证指标,快速验证想法。

  • 小规模模型训练

针对小规模数据集,训练参数量较小的模型,开发机可满足单机训练需求,无需复杂的算力调度,兼顾便捷性和训练效率,适合个人开发者或小团队快速完成小型任务研发。

三、操作指引

下文为操作示例,最佳实践请查看:开发机 ms-swift 框架最佳实践

💰 账户额度提示

1.欠费状态限制
a. 余额➕信用额度无法覆盖本次任务1小时使用时长所需费用时,将无法正常新建任务;若额度足够覆盖,允许新建任务
b. 欠费状态下运行中的任务将继续运行

2. 冻结状态限制
a. 冻结状态不支持新建任务、开机及扩容
b. 允许用户查看开发机详情、关闭开发机
c. 当账户状态由欠费变为冻结时,任务将自动中断

3. 冻结后使用平台能力
a. 冻结状态下用户无法新建,请先充值,使账号状态恢复正常
b. 在完成充值后,因冻结被关机的开发机【需用户手动操作开机后】再继续使用,当账户余额➕信用额度可覆盖任务1小时使用时长所需费用时,开发机才能恢复运行

3.1 新建开发机

  1. 权限申请:
  • 主账号(即溪流湖账户)拥有账号下所有项目的访问/管理权限,无需权限申请;
  • 子账号:可由主账号为名下子账号设置某项目的只读/管理权限;
  1. 若账户余额不足,请先充值
  2. 确认权限及余额无问题后,在左侧导航栏中「模型定制」下方点击「模型研发」进入产品页面。点击列表页面左上方的「+新建开发机」进入创建页面,在创建页面填写相关参数,具体参数如下:

基础信息

1.名称及描述:用户可根据自身需求配置实例名称及描述。

环境配置

1.计费方式:当前仅支持后付费模式,即按实际使用时长付费,适合短期、弹窗需求,性价比更高。后付费模式下实例运行成功后开始计费,关机后停止计费

2.实例规格:选择地域及实例规格,平台针对每种类型GPU提供了梯度丰富的CPU和内存规格,以帮助用户提高支配的灵活度及资源利用率。

3.镜像:万擎为用户提供了常用开源框架及Python版本的预置镜像。以:pytorch: 2.4.0-ubuntu-22.04-cuda-12.4.0-python-3.10.15为例,其代表PyTorch版本为2.4.0、Ubuntu版本为22.04、CUDA版本为12.4.0、Python版本为3.10.15。

存储配置

1.系统盘:共100GB,用于存储开发过程中的文件,不额外收费。系统盘仅用于临时存储,删除开发机时,系统盘数据将一并删除,无法恢复,如果您需要永久性存储,可以选择共享存储。

2.共享存储:提供高可靠、高可用、高性能的分布式文件存储服务,可存储模型文件或训练数据,其数据不会因开发机删除、结束运行或异常而丢失。共享存储创建后开始计费,删除后停止计费。用户可在创建开发机页面选择共享存储时删除不需要的存储服务,或在列表页点击编辑按钮进行删除。

【⚠️ 提示:存在创建中、启动中、运行中的开发机使用某个存储服务时,该存储服务无法删除】

具体计费说明请点击计费规则查看。

3.2 开发机列表

当项目下存在开发机时,用户可在模型研发页面查看该项目下的所有开发机,包括开发机名称、状态、镜像等信息。对于运行中的开发机,点击「打开」进入在线IDE页面,用户可根据需要切换不同的环境。

点击某个开发机名称将进入开发机详情页面,详情页面展示该开发机的名称、地域、镜像、运行时长等基础信息、存储配置及计费规则。

上一篇:模型量化下一篇:开发机 ms-swift 最佳实践
该篇文档内容是否对您有帮助?
有帮助没帮助