升级指南
本升级指南仅适用于已安装 OpenPAI >= v1.0.0 并希望将当前集群升级到较新版本的用户。例如,从 v1.0.0 升级到 v1.1.0。如果要将 v1.0.0 之前的版本升级到 >= v1.0.0 版本,请参考安装指南。
升级过程主要是关于修改 services-configuration.yaml 和使用 paictl。如果您不熟悉它们,请首先参考这里来设置 paictl 和 services-configuration.yaml。
结束所有服务和Dev Box容器
首先,启动当前 PAI 版本的 dev box 容器,通过以下方式停止所有服务:
./paictl.py service stop
该命令将要求提供集群 id 进行确认。如果忘记了它,可用命令 ./paictl.py config get-id 找回。
停止 PAI 服务不会影响您当前正在运行的任务。
使用 exit 离开 dev box 容器。通过以下方式将其删除:
sudo docker stop dev-box
sudo docker rm dev-box
修改 services-configuration.yaml
现在,启动新版本的 dev box 容器。例如,如果要升级到 v1.1.0,则应使用 docker openpai/dev-box:v1.1.0。
然后,通过以下方式拉取您的配置:
./paictl.py config pull -o <config-folder>
在 <config-folder>/services-configuration.yaml 中找到以下部分:
cluster:
# the docker registry to store docker images that contain system services like frameworklauncher, hadoop, etc.
docker-registry:
......
tag: v1.0.0
......
将 tag 更改为想要升级到的版本,例如 v1.1.0,然后保存文件。
通过以下方式上传修改后的 services-configuration.yaml:
./paictl.py config push -p <config-folder> -m service
启动所有服务
通过以下方式启动所有的 PAI 服务:
./paictl.py service start
启动所有服务后,OpenPAI 集群已成功升级。