[ English | 日本語 | Deutsch | Indonesia ]

处理完全故障

处理完全系统故障(例如数据中心断电)的常见方法是为每个服务分配优先级,并按优先级顺序恢复。 表. 服务恢复优先级示例 展示了一个示例。

表. 服务恢复优先级示例

优先级

服务

1

内部网络连接

2

备份存储服务

3

用户虚拟机公共网络连接

4

nova-compute, cinder 主机

5

用户虚拟机

10

消息队列和数据库服务

15

Keystone 服务

20

cinder-scheduler

21

镜像目录和交付服务

22

nova-scheduler 服务

98

cinder-api

99

nova-api 服务

100

仪表板节点

使用此示例优先级列表,以确保尽快恢复影响用户的服务,但前提是已经建立了一个稳定的环境。 当然,尽管列为单行项目,但每个步骤都需要大量的工作。 例如,在启动数据库后,您应该检查其完整性,或者在启动 nova 服务后,您应该验证虚拟机监控程序是否与数据库匹配,并修复任何不匹配项。