改进高可用性指南

改进高可用性指南

https://blueprints.launchpad.net/openstack-manuals/+spec/implement-ha-guide-todos

问题描述

目前,高可用性 (HA) 指南尚不完整。信息稀疏,并且有些部分尚未填写。

当前的指南也与当前最佳实践不符,并且包含了一些应该删除的不必要信息。

提议的变更

首先,就指南的预期受众和高级用例达成共识

  • 作为云部署者,我需要一份 OpenStack HA 指南,以便我能够理解构建 HA OpenStack 云的架构原理,以及实施所涉及的具体步骤。
  • 作为云运维者,我需要一份 OpenStack HA 指南,以便我能够理解现有 HA OpenStack 云的工作方式以及维护所需的条件。

基于该共识,本规范建议 HA 指南旨在定义、证明并解释使用 Pacemaker 集群管理器提供的高可用性设置的高级架构

  • 检测和恢复机器和应用程序级别的故障
  • 应用程序之间的启动/关闭顺序
  • 对必须/不得在同一机器上运行的其他应用程序的偏好
  • 对任何故障或集群状态的可靠响应

该指南旨在跨所有发行版保持相关性,同时不试图给出有关如何在每个发行版上实现 HA 的每一个细节。它还将避免重复太多可以在其他地方找到的信息。例如,给定发行版的软件包的基本安装。

由于现有的指南已经包含大量有帮助且相关的信息,因此本指南的建议旨在避免任何大刀阔斧的修改,而是倾向于增量式更改。

Andrew Beekhof(专业团队负责人)建议使用以下文档作为参考,为改进的指南提供更新的信息:https://github.com/beekhof/osp-ha-deploy/blob/master/ha-openstack.md

注意

上述 Github 文档包含大量 Red Hat 内容。其中一些内容可能会包含在 HA 指南的最终出版物中,但其结构将使其能够轻松添加其他发行版/工具的支持者。

备选方案

  • 保持指南不变,让社区随着时间的推移慢慢地对其进行改进。
  • 废弃该指南,将相关信息迁移到其他指南并对其进行适当的归档。

实现

负责人

  • Andrew Beekhof - beekhof
  • Adam Spiers - aspiers
  • Alexandra Settle - asettle

工作项

  1. 遍历 HA 指南错误列表(参见参考项目 2),删除过时内容,并处理任何相关且当前有效的错误。
  2. 遍历 HA 指南并删除过时或不相关的信息。
  3. 重新架构指南以适应新的结构。
  4. 引入基于上述 Github 文档和主题专家 (SME) 内容的新内容。

依赖项

  • 可能取决于社区参与和主题专家提供内容。

测试

该文档将在更新时由社区进行测试。

Creative Commons Attribution 3.0 License

除非另有说明,本文档根据 知识共享署名 3.0 许可协议 授权。请参阅所有 OpenStack 法律文件

docs-specs