Gear 数据绑定
可绑定的内容
在容器创建或者重启时,可以选择绑定数据到容器里,即使是规模巨大的数据集也可以绑定进来以文件系统的方式直接访问。可以绑定的内容包含以下几类:
- 公开数据集
- 个人私有的数据集
- 公开教程的工作目录
- 个人私有的执行的工作目录
- 上传新的代码
如下图所示,在容器的「数据绑定」界面,所有可供绑定的数据都会被列出,同时你也可以通过名称、ID 等字段进行筛选。
绑定到工作目录
每次容器执行任务时,都会创建一个独立的存储空间并绑定到 /openbayes/home
目录,这被称为其工作目录。此目录也以软链接的方式指向 /openbayes/home
目录。执行关闭后,工作目录中的内容会被保存下来 ,这就是所谓的执行「工作目录」。
请注意,绑定到工作目录实际上涉及到数据的复制过程,因此,容器的启动时间可能会因绑定的数据量的大小而变化,并且这也会占用工作目录的存储空间。
绑定到数据目录
除了工作目录之外,你还可以在创建容器时选择将数据绑定到以下根目录:
-
/openbayes/input/input0
-
/openbayes/input/input1
-
/openbayes/input/input2
-
/openbayes/input/input3
-
/openbayes/input/input4
数据目录的绑定有两种模式:
- 读写(read-write)绑定:允许你对绑定的数据进行添加、更新、删除操作。
- 只读(read-only)绑定:你只能读取绑定的数据,无法进行添加、更新、删除操作。
读写绑定
对于具有读写权限的数据集或模型,你可以选择「读写绑定」。此模式下,你可以直接访问对应的目录并更新数据。以下场景适合使用读写绑定:
- 对上传的原始数据集进行预处理,删除不需要的数据。
- 绑定两个数据集,从一个数据集中抽取部分数据,然后保存到另一个数据集中。
- 创建一个空的数据集版本,然后将容器中的数据保 存到其中。
- 创建一个空的数据集版本,然后使用 rsync 命令将本地的数据复制到其中。
信息
只有拥有读写权限的数据集或模型才能进行读写绑定。对于没有读写权限的公共数据集,以及其他执行的工作目录,你只能进行「只读」绑定。
只读绑定
对于没有读写权限的公开数据集、公开模型、以及其他人创建的公开教程等,你只能进行「只读绑定」。此模式下,你只能读取数据,无法进行添加、更新、删除操作。
如上图所示,对于只读绑定的数据,容器创建页面会显示相应的提示信息。