跳到主要内容

9 篇博文 含有标签「数据集」

查看所有标签

2020-9 更新

· 阅读需 1 分钟
Shanchuan Xu
Shanchuan Xu
Backend Developer

新功能

  • 所有的镜像里为 Conda 指定了默认的国内源,提升安装速度
  • 支持将数据集的目录创建为一个新的数据集版本,见文档
  • 调整了容器展示界面,优先展示最新一次执行的文件内容

  • 允许公开自己的数据仓库 / 容器,见公开容器以及公开数据仓库
  • 暴露 JupyterLab 的链接,方便与 VS Code、PyCharm 的集成

对「数据集」概念的变更

· 阅读需 1 分钟
Shanchuan Xu
Shanchuan Xu
Backend Developer

之前 OpenBayes 数据存储功能被称为「数据集」,这更容易被理解为机器学习场景下的标注数据,而实际上这里除了放置标注数据外也可以放置其他任意类型的数据,包括代码、训练的模型文件等。

为了避免这个歧义,也是为新的「模型部署」功能做准备,OpenBayes 对原有的「数据集」概念做了调整,将「数据集」改称作「数据仓库」。

对其概念的更新也同步到了文档中:

2019-11 更新

· 阅读需 1 分钟
Sparanoid
Sparanoid
Frontend Developer

新功能

  • 数据集和代码的上传支持更多的压缩包格式,如果不是压缩包也可以支持单个文件的上传,具体信息见文档
  • 数据集版本支持增量更新了,具体信息见文档
  • 数据集和容器都支持搜索了
  • 拆分了独立的「公开资源」部分,对资源进行了分类并支持资源的搜索

修复和增强

  • 在「继续执行」时强制确认是否绑定上一次执行的内容
  • 恢复了 tensorflow-1.12tensorflow-1.11 的运行时环境
  • 创建容器时更详细的进度展示,尤其是在需要数据的拷贝时展示拷贝的进度
  • 容器和数据集恢复了对中文名称的支持

2019-8 更新

· 阅读需 1 分钟
Sparanoid
Sparanoid
Frontend Developer

修复与增强

  • 修复了从容器输出拷贝到数据集报错的问题
  • 修复了错误的 tensorflow 版本 1.16 -> 1.13
  • 支持的港澳台地区的手机号

2019-7 更新 #3

· 阅读需 1 分钟
Sparanoid
Sparanoid
Frontend Developer

新功能

  • 增加了新的镜像
    • tensorflow-1.14
    • tensorflow-2.0.0beta
    • pytorch-1.0.1
    • pytorch-1.1.0
  • 新增了大量的公开数据集

修复与增强

  • 不再允许在数据集、容器名字中使用中文字符, 这一开始可能会给大家带来困扰,但是会在未来提升命令行工具的友好度,中文描述可以放在容器、数据集的「描述」字段
  • 更新对容器空闲的提醒文案,强调容器的负载超过 1% 那么容器将不会被关闭,详细信息请见 Jupyter 的自动关闭

2019-7 更新 #2

· 阅读需 1 分钟
Sparanoid
Sparanoid
Frontend Developer

新功能

  • 开启的容器监控增加 GPU 的利用率和显存
  • 支持从容器的输出创建版本到数据集,见文档

修复与增强

  • 增加了镜像的缓存,减少容器的拉取时间
  • 更新了容器启动流程,减少容器启动时间

2019-7 更新

· 阅读需 1 分钟
Sparanoid
Sparanoid
Frontend Developer

新功能

  • 我们正式提供命令行工具 bayes,通过命令行工具可以大大提升本地提交代码的体验,使用方式参见 bayes 命令行工具入门

错误修复与增强

  • 修复数据集列表页面在进入数据集的时候会偶尔报错的问题
  • 修复运行中容器的日志输出只显示一行的问题
  • 修复了文件输入/输出的内容显示错误

2019-3 更新 #3

· 阅读需 2 分钟
Sparanoid
Sparanoid
Frontend Developer

错误修复

  • 数据集上传锁定整个数据集的问题,现在如果某一个版本出了问题不影响新版本的创建
  • 数据集 / 代码 zip 上传的验证和提示

新的功能

  • 容器按照操作时间进行排序
  • 增加 4 个公有数据集
    • AISHELL:178 小时中文普通话数据库(19.3 GB)
    • SynthText:由 80 万个图像组成,约有 800 万个合成单词实例(48 GB)
    • DOTA:2806 幅航拍图像,包含 188,282 个实例,每个实例由任意(8 d.o.f.)四边形标记(19.8 GB)
    • BERT:由 Google 发布的 BERT 预训练模型(5 GB)
  • JupyterLab 替换了 Jupyter Notebook
  • 新的 MXNet(v1.3.0)镜像支持
  • 支持 TensorBoard
    • 目前 OpenBayes 容器在创建 Task 或 Jupyter Notebook 时都已经支持了 TensorBoard 
  • metrics 展示界面
    • OpenBayes 默认提供了执行时的关键指标的展示,目前支持的有 CPU 以及 内存。未来将支持更多的指标 

界面增强

  • 创建容器时的镜像选择组件
  • 数据集绑定组件的展示方式
  • 新的数据集界面
  • 新的容器展示界面