数据集管理

Updated , 去 GitHub 贡献本页面

数据集的创建和数据的上传

在导航栏点击 “新建数据集” 输入数据集名称,描述可以创建一个空数据集。

数据集创建后可以在数据集页面点击 “上传压缩包” 通过 zip 包的方式上传数据。数据上传后,OpenBayes 会将压缩包解压并同步其中数据,这个过程所需时间因数据包大小不同而不同。

数据集的版本

数据集每次创建成功后将会以递增的方式添加一个版本,可以在页面上「版本」的 Tab 中查看所有上传数据的版本。

注意 目前「数据集」尚不支持对特定版本进行修改,只能通过上传新的版本修改数据集的内容。

如果在上传后发现数据集版本一直处于「处理中」的状态则可能是因为数据集的解压出现了问题,这个时候可以尝试重新上传数据,数据集会为新的上传递增一个版本。上传失败的数据集可以直接删除。

绑定数据集到容器

在创建容器时,绑定数据可以选择所创建的数据集将其绑定到容器中指定的目录中。

数据版本的删除与整个数据集的删除

上文提到,数据集下可以包含多个版本,如果不再需要某一个特定的版本,可以在「版本」列表右侧的「删除」按钮处进行删除。该版本被删除后,其所占用的存储资源将会被释放。

当然整个数据集如果不再需要后也可以被永久删除,删除后该数据集下的各个版本都将被删除,也将不再占用用户的存储配额。

macOS 下大尺寸 zip 包的上传

zip 原始的标准最多支持大小为 4GB 的压缩包,以及最多包含 65535 个文件,新的 zip64 标准对其进行了扩展,支持了更大的压缩包和更多的文件个数。然而 macOS Sierra 以及其之后的版本默认的压缩工具在压缩超过 4GB 的内容时并没有支持这个标准,这会导致在 macOS 上压缩的超过 4GB 的压缩包无法在 OpenBayes 被成功解压并上传。因此请 macOS 的用户使用 Keka 或者其他支持 zip64 标准的压缩工具。