跳到主要内容

配额限制

资源额度和配额限制

OpenBayes 中和资源使用相关的限制,主要分为两类:

  1. 资源额度 / 余额:决定当前是否还有可用的计算时长、存储空间或账户余额。
  2. 配额限制(limitation):决定当前账号最多允许创建多少个资源,或者最多允许同时运行多少个资源。

用户在不同资源下的额度余额可在「账号设置」-「资源使用状况」页面查看:

运行系统会优先从该页面所展示的算力资源中扣费,默认每小时进行一次扣费。当这里的算力时间配额用尽时,系统会开始从用户的余额中扣费。如果用户的余额不足以支付当前运行的算力资源,系统将会停止运行该算力容器。

信息

即使账户余额充足、集群中仍有空闲资源,只要触发了 limitation,也仍然无法继续创建或启动对应资源。因此,能否启动一个容器,通常需要同时满足以下条件:

  • 账号仍有足够的资源额度或余额;
  • 当前资源没有超过 limitation;
  • 集群里确实还有空闲资源。

配额限制(limitation)是什么

配额限制用于控制当前账号下资源的最大并发,以及各类资源可拥有的总数量。它的作用是限制账号的使用上限,而不是修改当前余额或集群规模。

在「账号设置」-「资源使用状况」-「配额限制」中,可以看到当前账号的主要 limitation:

常见的 limitation 可以分为以下几类:

1. 各类算力资源的并行限制

例如 cpucpu-xlargertx-4090a6000 等资源,都会分别配置一个并行上限,表示该账号同时运行中的该类资源实例数不能超过这个值。

当某个资源已经达到上限时,再次创建对应容器会报错,例如:

资源 RTX-3090 超出个人限制

将某个资源的限制设置为 0,表示当前账号被禁止使用该资源。

2. GPU 类型的总量限制

除了按资源名称分别限制并发数外,平台还会按 GPU 类型 设置一个额外的总量上限,例如 A6000V100-32RTX-4090 等。

这类限制和上面的“资源并行限制”是同时生效的:

  • 资源 limitation 限制的是某个具体资源可以并行运行多少个实例;
  • GPU limitation 限制的是某一类 GPU 总共最多能被占用多少张。

例如,某个资源每个实例需要 2 张 A6000

  • 如果该资源的并行限制为 3,理论上最多可开 3 个实例;
  • 但如果 A6000 的 GPU 限制只有 4,那么实际上最多只能同时开 2 个实例。

因此,最终可运行的数量,取决于资源 limitation 和 GPU limitation 两者中更严格的那个

3. 数据集、容器(项目)和模型部署个数限制

除了运行时并发限制外,账号还会有“拥有数量”方面的限制,包括:

  • 私有数据集个数限制;
  • 公有数据集个数限制;
  • 私有容器个数限制;
  • 公有容器个数限制;
  • 私有模型部署个数限制;
  • 公有模型部署个数限制。

这里限制的是该账号当前拥有的资源数量,而不是同时运行中的数量。

其中模型部署(Serving)也分为私有和公开两类:

  • 创建新的私有模型部署时,会检查私有模型部署个数限制;
  • 将一个私有模型部署改为公开时,会检查公有模型部署个数限制;
  • 如果当前个数已达到上限,则无法继续创建或公开对应的模型部署。

4. 组织个数限制

个人账号还会有“可创建的组织个数限制”。当达到上限后,将无法继续创建新的组织。

5. 组织成员 limitation

除了账号级和组织级 limitation 外,组织还可以为成员设置单独的 limitation。

  • 成员 limitation 目前主要用于限制成员在组织内可使用的各类资源并行数;
  • 成员 limitation 不会放宽组织本身的 limitation,而是会和组织 limitation 同时生效;
  • 因此,成员实际可使用的上限,取决于“成员 limitation”和“组织 limitation”中更严格的那个。

例如,组织的 rtx-4090 并行限制为 4,某个成员的 rtx-4090 limitation 为 1,那么该成员最多只能同时使用 1 个对应资源实例,即使组织整体还有剩余配额也不例外。

更多说明见 组织资源管理

6. 运行中的快照个数限制

工作空间创建快照时,平台会限制当前账号同时处于未完成状态的快照数量。只有已有快照完成或被删除后,才能继续创建新的快照。

7. 单次上传大小限制

页面中还会显示“上传资源限制(MB)”,表示当前账号单次上传数据时允许的最大体积

这项限制和前面的“数量 / 并发 limitation”不同,它主要受当前剩余存储空间影响。如果剩余存储空间不足,即使其他 limitation 仍有余量,也可能无法继续上传更大的文件。