数据仓库 FAQ(常见问题解答)
如何修改数据集中的内容?
目前数据集不支持对特定版本中的文件进行删除(删除某个文件),但支持部分修改行为。具体的支持情况为:
- 在当前版本中,通过「上传数据到当前目录」功能,添加新文件到当前版本
- 在当前版本中,通过「上传数据到当前目录」功能,上传同名的新文件覆盖已有的文件内容
如果您想在工作空间中修改数据集,请将修改后的内容保存至容器的工作目录,然后在容器关闭并同步后,您可以将指定的目录复制到数据集。
上传立即成功但没有在页面看到新的文件
在某些情况下 OpenBayes 会认为某些文件已经存在了(即使文件并没有被成功的上传),这会导致点击上传后,上传对话框立即关闭并提示文件已经上传成功。
这种情况可以再次点击刚刚使用的「上传新版本」或者「上传至当前目录」,点击右上角的「清理上传缓存」后再次尝试上传流程。
自动解压的顶级目录丢失了
我们在对一个文件夹做压缩的时候可以有以下两种方式:
直接将文件加压缩:
在文件夹下将文件全选后打包:
对于第一种方式压缩包中实际上会多一层目录,在解压后也会出现一个顶级目录。对于第二种方式,压缩包中是平铺了一系列的文件,解压后不会包含一个额外的目录。
大部分的开发者会使用第一种方式进行文件夹的压缩,但并没有意识到这样解压的文件会多一层目录。为了方便大多数的场景,当压缩包名称和其顶级目录名称一致时,我们会自动帮助删除这层目录。举个例子:
我将一个目录 train
做了压缩,默认生成一个名为 train.zip
的文件。上传后,OpenBayes 会自动将顶级目录 train
删除保留其下的文件。
如果希望保留 train
这层目录,可以在上传时将 train.zip
重命名为 train_.zip
这样的名字,上传后 OpenBayes 发现文件名(train_
)和顶级目录 train
不相同,会保留这层目录。
自动解压后显示失败
在压缩包上传后如果显示「上传失败,请确认数据包格式」则说明 OpenBayes 完全无法解压该压缩包,建议以其他格式打包后上传。
自动解压后实际文件个数变少了
压缩包打包时有多种原因会导致解压的全部或者部分失败:
- 字符编码格式不兼容,比如 Windows 下默认的中文文件字符编码问题
- 压缩包由于反复传输导致的部分文件的损坏
- 压缩包采用了不兼容的格式,见 macOS 大尺寸 zip 包上传
OpenBayes 会尝试多种解压工具对压缩进行解压,尽量保证压缩包的完整。但在多种尝试过后依然有可能丢失部分已经损毁的数据。因此如果发现解压后的结果和实际本地解压的结果不符,可以尝试将已经解压的本地数据重新打包或者通过部分打包多次上传的形式传输。
macOS 下大尺寸 zip 包的上传
zip
最初的标准最多支持大小为 4GB 的压缩包,以及最多包含 65535 个文件。
而新的 zip64
标准对其进行了扩展,支持了更大的压缩包和更多的文件个数。然而 macOS Sierra 以及其之后的版本默认的压缩工具在压缩超过 4GB 的内容时并没有支持这个标准,这会导致在 macOS 上压缩的超过 4GB 的压缩包无法在 OpenBayes 被成功解压并上传。
因此请 macOS 的用户使用 Keka 或者其他支持 zip64
标准的压缩工具。