

开发机是万擎为用户提供的在线交互式开发环境,专为 AI 模型研发场景设计,致力于为用户提供“开箱即用”的云端开发体验。通过封装标准化的开发环境配置流程,开发机彻底免去了用户本地搭建、调试开发环境的繁琐操作,同时实现代码管理与开发环境管理的一体化,让用户能够聚焦模型研发核心任务。
核心适配:模型研发初期的轻量开发、即时调试、效果验证,无需大规模算力,侧重“便捷性、即时性、可视化”。
在IDE(当前支持VSCode和Terminal)中更加方便快捷地修改模型架构、损失函数、优化器参数,训练数个Epoch并实时观察损失曲线与验证指标,快速验证想法。
针对小规模数据集,训练参数量较小的模型,开发机可满足单机训练需求,无需复杂的算力调度,兼顾便捷性和训练效率,适合个人开发者或小团队快速完成小型任务研发。
下文为操作示例,最佳实践请查看:开发机 ms-swift 框架最佳实践
💰 账户额度提示
1.欠费状态限制
a. 余额➕信用额度无法覆盖本次任务1小时使用时长所需费用时,将无法正常新建任务;若额度足够覆盖,允许新建任务
b. 欠费状态下运行中的任务将继续运行
2. 冻结状态限制
a. 冻结状态不支持新建任务、开机及扩容
b. 允许用户查看开发机详情、关闭开发机
c. 当账户状态由欠费变为冻结时,任务将自动中断
3. 冻结后使用平台能力
a. 冻结状态下用户无法新建,请先充值,使账号状态恢复正常
b. 在完成充值后,因冻结被关机的开发机【需用户手动操作开机后】再继续使用,当账户余额➕信用额度可覆盖任务1小时使用时长所需费用时,开发机才能恢复运行
基础信息
1.名称及描述:用户可根据自身需求配置实例名称及描述。
环境配置
1.计费方式:当前仅支持后付费模式,即按实际使用时长付费,适合短期、弹窗需求,性价比更高。后付费模式下实例运行成功后开始计费,关机后停止计费。
2.实例规格:选择地域及实例规格,平台针对每种类型GPU提供了梯度丰富的CPU和内存规格,以帮助用户提高支配的灵活度及资源利用率。
3.镜像:万擎为用户提供了常用开源框架及Python版本的预置镜像。以:pytorch: 2.4.0-ubuntu-22.04-cuda-12.4.0-python-3.10.15为例,其代表PyTorch版本为2.4.0、Ubuntu版本为22.04、CUDA版本为12.4.0、Python版本为3.10.15。
存储配置
1.系统盘:共100GB,用于存储开发过程中的文件,不额外收费。系统盘仅用于临时存储,删除开发机时,系统盘数据将一并删除,无法恢复,如果您需要永久性存储,可以选择共享存储。
2.共享存储:提供高可靠、高可用、高性能的分布式文件存储服务,可存储模型文件或训练数据,其数据不会因开发机删除、结束运行或异常而丢失。共享存储创建后开始计费,删除后停止计费。用户可在创建开发机页面选择共享存储时删除不需要的存储服务,或在列表页点击编辑按钮进行删除。
【⚠️ 提示:存在创建中、启动中、运行中的开发机使用某个存储服务时,该存储服务无法删除】
具体计费说明请点击计费规则查看。
当项目下存在开发机时,用户可在模型研发页面查看该项目下的所有开发机,包括开发机名称、状态、镜像等信息。对于运行中的开发机,点击「打开」进入在线IDE页面,用户可根据需要切换不同的环境。
点击某个开发机名称将进入开发机详情页面,详情页面展示该开发机的名称、地域、镜像、运行时长等基础信息、存储配置及计费规则。