系统指标与自定义指标
展示关键的 Metrics
OpenBayes 默认提供了执行时的关键指标的展示,目前支持的有 CPU 、内存、gpu-0-memory
、gpu-0-util
以及 存储资源。未来将支持更多的指标。
自定义 Metrics
OpenBayes 提供一个 Python 的库 openbayestool 用于在 Python 程序中自定义记录一些关键的 metrics 并展示到用户的容器执行页面之上:
openbayestool 使用方式如下所示:
from openbayestool import log_param, log_metric, clear_metric
# 记录参数 `learning_rate=0.01`
log_param('learning_rate', 0.01)
# 同一参数将会记录最后一个请求的结果 `foo=3`
log_param('foo', 1)
log_param('foo', 2)
log_param('foo', 3)
# 记录模型的运行结果 `precision=0.77`
log_metric('precision', 0.77)
# 同一个结果 precision 多次记录会追加结果,即结果为 [0.79, 0.82, 0.86]
log_metric('precision', 0.79)
log_metric('precision', 0.82)
log_metric('precision', 0.86)
# 清理一个自定义的 metric,注意只有在运行中的容器中可以这么做
clear_metric('precision')