在该板块中,用户可查看账户下所有产生用量的模型数、消耗token总数、输入token总数、输出token总数、Prompt cache token总数等信息,也可自定义查询周期,根据需要进行查询。
在线推理
模型维度
该板块对用户在线推理的模型用量进行统计,用户可查看以下信息:
页面截图 | 参数说明 |

| - 项目:默认为当前项目,用户可切换所属项目,可切换为该账号下所有空间项目且支持多选;
- 周期:支持自定义查询周期,用量记录永久保存,最大查询时间跨度为31天;
- 模型总数:筛选条件下,所有产生了用量的模型数;
- 消耗token总数:筛选条件下,所有调用输入/输出消耗token的总数;
- 输入token总数:筛选条件下,所有调用输入消耗token的总数;
- 输出token总数:筛选条件下,所有调用输出消耗token的总数;
- Prompt cache token总数:筛选条件下,所有调用Prompt cache token的总数。
|
用量详情
用户在「用量统计」页选中某个模型后,将展示该模型的用量详情:
模型体验的用量详情仅支持筛选聚合维度及统计周期。
页面截图 | 参数说明 |

| - 聚合:页面默认展示该模型按分钟聚合的近7天调用数据,用户可选择按天/小时/分钟聚合;
- 周期:支持自定义查询周期,用量记录永久保存,最大查询时间跨度为31天;
- API Key:API Key默认选择全部,用户可选择查询周期内调用过的API Key;
- 消耗token总数:筛选条件下,所有调用输入/输出消耗token的总数;
- 输入token总数:筛选条件下,所有调用输入消耗token的总数;
- 输出token总数:筛选条件下,所有调用输出消耗token的总数;
- Prompt cache token总数:筛选条件下,所有调用Prompt cache token的总数。
|
批量推理
用量统计
该板块对用户当前项目下的模型用量进行统计,用户可查看以下信息:
页面截图 | 参数说明 |

| - 项目:默认为当前项目,用户可切换所属项目,可切换为该账号下所有空间项目且支持多选;
- 周期:支持自定义查询周期,用量记录永久保存,最大查询时间跨度为365天;
- 模型总数:筛选条件下,所有产生了用量的模型数;
- 消耗token总数:筛选条件下,所有调用输入/输出消耗token的总数;
- 输入token总数:筛选条件下,所有调用输入消耗token的总数;
- 输出token总数:筛选条件下,所有调用输出消耗token的总数。
|
用量详情
用户在「用量统计」页选中某个模型后,将展示该模型的用量详情:
页面截图 | 参数说明 |

| - 聚合:页面默认展示该模型按分钟聚合的近7天调用数据,用户可选择按天/小时/分钟聚合;
- 周期:支持自定义查询周期,用量记录永久保存,最大查询时间跨度为365天;
- API Key:API Key默认选择全部,用户可选择查询周期内调用过的API Key;
- 消耗token总数:筛选条件下,所有调用输入/输出消耗token的总数;
- 输入token总数:筛选条件下,所有调用输入消耗token的总数;
- 输出token总数:筛选条件下,所有调用输出消耗token的总数。
|