logologo
logo
热门活动
HOT
产品
解决方案
客户价值
文档
支持与帮助
售前咨询
快手万擎(Vanchin)
开始使用
产品介绍
模型介绍
模型服务
模型定制
模型研发
模型托管
模型评测
数据管理
系统管理
产品计费
API说明
常见问题
相关协议
文档中心
模型服务模型研发开发机

开发机


开发机是万擎为用户提供的在线交互式开发环境,专为 AI 模型研发场景设计,致力于为用户提供“开箱即用”的云端开发体验。通过封装标准化的开发环境配置流程,开发机彻底免去了用户本地搭建、调试开发环境的繁琐操作,同时实现代码管理与开发环境管理的一体化,让用户能够聚焦模型研发核心任务。

一、核心能力

  • 高效开发:为用户提供云端AI开发IDE,当前支持VSCode及Terminal;同时支持通过SSH方式登录开发机,用户可使用本地终端直接连接开发机进行开发调试,也可通过SCP命令实现本地与开发机之间的文件传输。
  • GPU资源:支持A10、4090、L20、X40等型号,可根据模型研发需求灵活选择适配的算力资源。
  • 共享存储:支持挂载分布式文件存储服务,实现云端开发机与远端存储的无缝对接。
  • 预置镜像:平台提供六大类预置镜像,满足用户不同开发场景,包括isaac-sim、cudagl、python、pytorch、verl及ms-swift。

二、适用场景

核心适配:模型研发初期的轻量开发、即时调试、效果验证,无需大规模算力,侧重“便捷性、即时性、可视化”。

  • 在线调试验证

在IDE(当前支持VSCode和Terminal)中更加方便快捷地修改模型架构、损失函数、优化器参数,训练数个Epoch并实时观察损失曲线与验证指标,快速验证想法。

  • 小规模模型训练

针对小规模数据集,训练参数量较小的模型,开发机可满足单机训练需求,无需复杂的算力调度,兼顾便捷性和训练效率,适合个人开发者或小团队快速完成小型任务研发。

三、操作指引

下文为操作示例,最佳实践请查看:开发机 ms-swift 框架最佳实践

💰 账户额度提示

1.欠费状态限制
a. 余额➕信用额度无法覆盖本次任务1小时使用时长所需费用时,将无法正常新建任务;若额度足够覆盖,允许新建任务
b. 欠费状态下运行中的任务将继续运行

2. 冻结状态限制
a. 冻结状态不支持新建任务、开机及扩容
b. 允许用户查看开发机详情、关闭开发机
c. 当账户状态由欠费变为冻结时,任务将自动中断

3. 冻结后使用平台能力
a. 冻结状态下用户无法新建,请先充值,使账号状态恢复正常
b. 在完成充值后,因冻结被关机的开发机【需用户手动操作开机后】再继续使用,当账户余额➕信用额度可覆盖任务1小时使用时长所需费用时,开发机才能恢复运行

3.1 新建开发机

  1. 权限申请:
  • 主账号(即溪流湖账户)拥有账号下所有项目的访问/管理权限,无需权限申请;
  • 子账号:可由主账号为名下子账号设置某项目的只读/管理权限;
  1. 若账户余额不足,请先充值
  2. 确认权限及余额无问题后,在左侧导航栏中「模型定制」下方点击「模型研发」进入产品页面。点击列表页面左上方的「+新建开发机」进入创建页面,在创建页面填写相关参数,具体参数如下:

基础信息

1.名称及描述:用户可根据自身需求配置实例名称及描述。

环境配置

1.计费方式:当前仅支持后付费模式,即按实际使用时长付费,适合短期、弹窗需求,性价比更高。后付费模式下实例运行成功后开始计费,关机后停止计费

2.实例规格:选择地域及实例规格,平台针对每种类型GPU提供了梯度丰富的CPU和内存规格,以帮助用户提高支配的灵活度及资源利用率。

3.镜像:万擎为用户提供了常用开源框架及Python版本的预置镜像。以:pytorch: 2.4.0-ubuntu-22.04-cuda-12.4.0-python-3.10.15为例,其代表PyTorch版本为2.4.0、Ubuntu版本为22.04、CUDA版本为12.4.0、Python版本为3.10.15。

存储配置

1.系统盘:共100GB,用于存储开发过程中的文件,不额外收费。系统盘仅用于临时存储,删除开发机时,系统盘数据将一并删除,无法恢复,如果您需要永久性存储,可以选择共享存储。

2.共享存储:提供高可靠、高可用、高性能的分布式文件存储服务,可存储模型文件或训练数据,其数据不会因开发机删除、结束运行或异常而丢失。共享存储创建后开始计费,删除后停止计费。用户可在创建开发机页面选择共享存储时删除不需要的存储服务,或在列表页点击编辑按钮进行删除。

【⚠️ 提示:存在创建中、启动中、运行中的开发机使用某个存储服务时,该存储服务无法删除】

具体计费说明请点击计费规则查看。

3.2 开发机列表

当项目下存在开发机时,用户可在模型研发页面查看该项目下的所有开发机,包括开发机名称、状态、镜像等信息。对于运行中的开发机,点击「打开」进入在线IDE页面,用户可根据需要切换不同的环境。

点击某个开发机名称将进入开发机详情页面,详情页面展示该开发机的名称、地域、镜像、运行时长等基础信息、存储配置及计费规则。

3.3 开发机使用

当开发机状态为「运行中」时,点击「打开」可进入在线调试页面

在线调试页面顶部可切换为不同IDE,当前支持VS Code、Terminal两种;鼠标悬浮至右侧图标可查看当前开发机配置信息及运行时长

上一篇:模型量化下一篇:开发机 ms-swift 最佳实践
该篇文档内容是否对您有帮助?
有帮助没帮助