词汇表¶

本页解释了 Watcher 系统中使用的不同术语。

它们按字母顺序排列。

动作¶

一个动作使得 Watcher 能够在审计之后转换集群的当前状态。

一个动作是一个原子任务，它会改变 OpenStack 集群的目标受管资源的当前状态，例如

使用 Nova 将实例从一个计算节点迁移到另一个计算节点
使用 ACPI 等方式更改计算节点的电源级别
使用 Nova 更改计算节点的当前状态（启用或禁用）

在大多数情况下，一个动作会触发 OpenStack 现有模块（Nova、Neutron、Cinder、Ironic 等）上的具体命令。

一个动作具有生命周期，其当前状态可能是以下之一

待处理 (PENDING)：动作尚未被 Watcher Applier 执行
已跳过 (SKIPPED)：动作将不会被执行，因为 Watcher Applier 发现了一个预定义的跳过条件，或者被管理员显式跳过。
进行中 (ONGOING)：动作正在被 Watcher Applier 处理
成功 (SUCCEEDED)：动作已成功执行
失败 (FAILED)：在尝试执行动作时发生错误
已删除 (DELETED)：动作仍然存储在 Watcher 数据库中，但不再通过 Watcher API 返回。
已取消 (CANCELLED)：动作处于 待处理 (PENDING) 或 进行中 (ONGOING) 状态，并被管理员取消

提供了一些默认实现，但也可以开发新的实现，这些实现将在 Watcher 启动时动态加载。

动作计划¶

一个动作计划指定了为满足给定目标而应按顺序执行的动作流程。它还包含估计的全局效能以及一组效能指标。

当审计成功时，Watcher 会生成一个动作计划。这意味着用于该审计的策略已经找到一个解决方案来实现该目标。

在 Watcher 的默认实现中，一个动作计划由一系列连续的动作 (即，属于唯一分支的动作工作流) 组成。

但是，Watcher 为其许多组件提供了抽象接口，允许其他实现生成和处理更复杂的动作计划，这些计划由两种类型的动作项组成

简单的动作：原子任务，这意味着它不能从 OpenStack 的角度拆分为更小的任务或命令。
复合动作：由多个简单的动作按照顺序和/或并行流程组成。

一个动作计划可以使用标准的流程模型描述格式来描述，例如业务流程模型和符号 2.0 (BPMN 2.0) 或统一建模语言 (UML)。

要查看动作计划状态的生命周期和描述，请访问动作计划状态机。

管理员¶

管理员是对 OpenStack 集群具有管理员访问权限的任何用户。该用户允许为租户创建新项目，创建新用户并向每个用户分配角色。

管理员通常可以远程访问集群的任何主机，以便更改配置并重新启动任何 OpenStack 服务，包括 Watcher。

在 Watcher 的上下文中，管理员是允许他们运行任何 Watcher 命令的用户角色，例如

创建/删除审计模板
启动审计
获取动作计划
手动启动推荐的动作计划
归档以前的审计和动作计划

管理员也允许修改任何 Watcher 配置文件并重新启动 Watcher 服务。

审计¶

在 Watcher 系统中，一个审计是优化集群的请求。

优化是为了满足给定集群上的一个目标而完成的。

对于每个审计，Watcher 系统会生成一个动作计划。

要查看审计状态的生命周期和描述，请访问审计状态机。

审计范围¶

审计范围是一组被审计的资源。审计范围应在每个审计模板（包含审计设置）中定义。

审计模板¶

一个审计可以使用相同的设置（目标、阈值等）多次启动。因此，将这些设置保存在某种审计预设对象中是有意义的，该对象被称为审计模板。

一个审计模板至少包含目标。

它还可能包含一些错误处理设置，指示

Watcher Applier 停止整个操作
Watcher Applier 执行回滚

以及在发生故障之前应尝试多少次重试（后者也可能很复杂：例如，最终在成功的动作上发生多次首次故障的情况）。

此外，一个审计模板可能包含与动作计划自动化程度相关的设置。一个标志将指示动作计划是否将自动启动，或者是否需要管理员手动确认。

可用区¶

请参阅 OpenStack 官方可用区定义。

集群¶

一个集群是一组物理机器，它们提供计算、存储和网络资源，并由相同的 OpenStack 控制节点管理。一个集群代表了云提供商能够为其客户提供的资源集合。

一个数据中心可能包含多个集群。

集群可以划分为一个或多个可用区。

集群数据模型 (CDM)¶

一个集群数据模型 (或 CDM) 是集群受管资源的当前状态和拓扑的逻辑表示。

它表示为一组受管资源（可能是一个简单的树或一个键值对的平面列表），这使得 Watcher 策略能够在审计期间了解不同资源之间的当前关系，并能够请求以下信息：

哪些计算节点在一个给定的审计范围中？
哪些实例托管在一个给定的计算节点上？
计算节点的当前负载是多少？
计算节点的当前可用内存是多少？
两个计算节点之间的网络链路是什么？
给定网络链路上的可用带宽是多少？
给定实例的给定虚拟磁盘上的当前可用空间是多少？
给定实例的当前状态是什么？
…

一言以蔽之，该数据模型使策略能够了解

集群的当前拓扑
每个受管资源的当前容量
每个受管资源的当前已用/空闲空间
每个受管资源的当前状态

在 Watcher 项目中，我们旨在为每个目标提供一些通用且基本的集群数据模型，这些模型可用于相关的策略，通过一种基于插件的机制，称为集群数据模型收集器（或 CDMC）。这些 CDMC 负责加载和保持与其关联的 CDM 的最新状态，通过监听事件以及定期从头开始重建它们。它们也直接可从策略类访问。这些 CDM 用于

简化针对给定策略的新策略的开发，当已经存在一些与相同目标关联的现有策略时
避免在几个与相同目标关联的策略中重复相同的代码
提高给定目标的不同策略之间的一致性
避免与任何外部集群数据模型产生强耦合（建议的数据模型充当枢纽数据模型）

在 Watcher 助手工具中，可能存在各种通用和基本的集群数据模型，每种模型都针对实现给定的目标而进行调整

例如，对于旨在优化网络资源的目标，策略可能需要知道哪些资源正在相互通信。
而对于旨在优化热量和功率条件的目标，策略可能需要知道每个计算节点在机架中的位置以及每个机架在机房中的位置。

但是，请注意，如果建议的数据模型不符合开发人员的需求，只要策略能够为请求的目标产生解决方案，开发人员可以使用他/她自己的集群数据模型。例如，开发人员可以依赖 Nova 数据模型来优化一些计算资源。

集群数据模型可以持久化在任何合适的存储系统中（SQL 数据库、NoSQL 数据库、JSON 文件、XML 文件、内存数据库等）。目前，正在后台构建和维护一个内存模型，以加速策略的执行。

控制器节点¶

请阅读 OpenStack 官方对控制器节点的定义。

在许多配置中，Watcher 将驻留在控制器节点上，即使它可以潜在地托管在专用机器上。

计算节点¶

请阅读 OpenStack 官方对计算节点的定义。

客户¶

客户是订阅云提供商服务的个人或公司。客户可能在同一个集群上托管多个项目，或者分散在不同的集群上。

在私有云环境中，客户是同一组织内的不同组（不同的部门、项目团队、分支机构等）。云基础设施包括精确跟踪每个客户的服务使用情况的能力，以便将其返还给他们，或者至少向他们报告。

目标¶

目标是人类可读、可观察和可衡量的最终结果，具有一个要实现的目标。

以下是一些目标的示例

最小化能源消耗
最小化计算节点的数量（整合）
平衡计算节点之间的工作负载
最小化许可成本（某些软件的许可模式基于部署软件的插槽或核心数量）
找到在给定主机组（可能是整个可用区）上进行计划维护的最适当时间：电源更换、冷却系统更换、硬件修改等。

主机聚合¶

请阅读 OpenStack 官方对主机聚合的定义。

实例¶

一个正在运行的虚拟机，或者处于已知状态的虚拟机，例如挂起，可以像硬件服务器一样使用。

受管理资源¶

受管理资源是受管理资源类型在具有特定属性和依赖于其他受管理资源（关系）的拓扑中的一个实例。

例如，受管理资源可以是一个托管在计算节点上的虚拟机（即实例），并通过网络链路（也表示为集群数据模型中的受管理资源）连接到另一个虚拟机。

受管理资源类型¶

受管理资源类型是集群的硬件或软件元素，Watcher 系统可以对其进行操作。

以下是一些受管理资源类型的示例

它可以是 OpenStack HEAT 中定义的可用资源类型的官方列表中的任何一种。

效能指标¶

效能指标是单个值，用于指示给定策略产生的解决方案的表现如何。这些效能指标特定于给定的目标，通常用于计算结果行动计划的全局效能。

在 Watcher 中，这些效能指标与它们相关的目标一起指定。当执行与目标相关的策略时，它会产生一个包含目标指定的效能指标的解决方案。该解决方案，已被 Watcher 规划器转换为行动计划，其指标和全局效能将被存储，并且现在可以通过 Watcher API 访问。

效能规范¶

效能规范是与每个目标关联的合同，定义了实现相关目标时策略应在其解决方案中提供的各种效能指标。确实，由策略提出的每个解决方案在计算其全局效能之前，都会根据此合同进行验证。

优化效能¶

优化效能是根据约束和 SLA 衡量实现目标的程度的客观度量，这些约束和 SLA 由客户定义。

效能的评估方式取决于要实现的目标。

当然，只要行动计划仍然相关（即集群的当前状态没有发生变化，以至于需要启动新的审计），效能才有效。

例如，如果目标是降低能源消耗，则效能将使用几个效能指标（KPI）计算

能源节约百分比（必须尽可能高）
SLA 违规数量（必须尽可能低）
虚拟机迁移数量（必须尽可能低）

所有这些指标都在给定的时间范围内计算，该时间范围是执行整个行动计划所花费的时间。

效能还使管理员可以客观地比较针对相同目标和相同集群工作负载的不同策略。

项目¶

项目代表 OpenStack 中的“所有权”的基本单位，即 OpenStack 中的所有资源都应由特定的项目拥有。在 OpenStack Identity 中，项目必须由特定的域拥有。

请阅读 OpenStack 官方对项目的定义。

评分引擎¶

评分引擎是一个可执行文件，具有明确的输入、明确的输出，并执行纯粹的数学任务。也就是说，计算不依赖于其运行的环境 - 它会在任何地方产生相同的结果。

由于构建特定数据模型（因此是评分引擎）可能使用多种算法，因此评分引擎的使用方式可能会有所不同。元信息字段应包含给定评分引擎的用户可能需要的任何信息。

SLA¶

SLA 代表服务级别协议。

资源在合同中由客户和云提供商协商确定。

大多数时候，该合同由两份文件组成

SLA：服务级别协议
SLO：服务级别目标

请注意，SLA 比 SLO 更通用，因为前者规定了要提供的服务、支持方式、时间、地点、成本、性能和相关各方的责任，而 SLO 侧重于更可衡量的特征，例如可用性、吞吐量、频率、响应时间或质量。

您还可以阅读维基百科关于 SLA 的页面，它提供了很好的定义。

SLA 违规¶

当与给定客户签订的 SLA 无法在官方合同文件中规定的时间范围内由云提供商遵守时，就会发生 SLA 违规。

SLO¶

服务级别目标 (SLO) 是服务提供商和客户之间 SLA 的关键要素。SLO 约定为衡量服务提供商的性能的一种方式，并概述为避免双方因误解而发生争议的一种方式。

您还可以阅读维基百科关于 SLO 的页面，它提供了很好的定义。

解决方案¶

解决方案是策略（即算法）执行的结果。每个解决方案由许多信息组成

由策略生成的一组操作，以实现相关审计的目标。
一组效能指标，由相关目标定义
全局效能，由相关目标使用上述效能指标计算。

一个解决方案与一个行动计划不同，因为它包含由一个策略产生的非计划性行动列表。换句话说，解决方案中的行动列表尚未被观察者规划器重新排序。

请注意，某些算法（即策略）可能会生成多个解决方案。这引发了确定应该应用哪个解决方案的问题。

可以设想两种处理方法

完全自动化模式：只有排名最高的解决方案（即，最高的优化效能）将被发送到观察者规划器并转换为具体的行动。
手动模式：将多个解决方案提议给管理员，并详细测量估计的优化效能，由他/她决定启动哪个方案。

策略¶

一个策略是一种算法实现，能够为给定的目标找到一个解决方案。

可能有多个潜在的策略能够实现相同的目标。这就是为什么可以配置为每个目标应该使用哪个特定的策略。

某些策略可能提供更好的优化结果，但可能需要更多时间才能找到最佳的解决方案。

观察者应用器¶

该组件负责执行由观察者决策引擎构建的行动计划。

有关此组件的更多详细信息，请参阅：系统架构。

观察者数据库¶

此数据库存储所有观察者领域对象，这些对象可以由观察者 API 或观察者 CLI 请求

审计模板
审计
行动计划
行动
目标

这里的观察者领域是“优化 OpenStack 系统提供的某些资源”。

有关此组件的更多详细信息，请参阅系统架构。

观察者决策引擎¶

该组件负责计算一组潜在的优化行动，以实现审计的目标。

它首先从相关的审计模板中读取审计的参数，并了解要实现的目标。

然后，它根据 Watcher 为此目标的配置方式选择最合适的策略。

然后执行策略，并生成一组行动，这些行动由观察者规划器随时间安排（即，它生成一个行动计划）。

有关此组件的更多详细信息，请参阅系统架构。

观察者规划器¶

观察者规划器是观察者决策引擎的一部分。

此模块接收由策略生成的行动集合，并构建工作流的设计，定义如何随时间安排这些不同的行动，以及每个行动的先决条件是什么。

为了防止在应用行动计划时集群过载，必须随时间安排行动。例如，重要的是不要同时迁移太多实例，以免网络拥塞降低 SLA，影响客户。

为了避免安全问题，例如对核心 OpenStack 服务的拒绝服务攻击，也必须随时间安排行动。

提供了一些默认实现，但可以开发新的实现，这些实现将在启动时由 Watcher 动态加载。

有关此组件的更多详细信息，请参阅系统架构。

术语表

词汇表¶

动作¶

动作计划¶

管理员¶

审计¶

审计范围¶

审计模板¶

可用区¶

集群¶

集群数据模型 (CDM)¶

控制器节点¶

计算节点¶

客户¶

目标¶

主机聚合¶

实例¶

受管理资源¶

受管理资源类型¶

效能指标¶

效能规范¶

优化效能¶

项目¶

评分引擎¶

SLA¶

SLA 违规¶

SLO¶

解决方案¶

策略¶

观察者应用器¶

观察者数据库¶

观察者决策引擎¶

观察者规划器¶

Watcher 15.0.1.dev4

页面内容