更多电源和散热数据

https://blueprints.launchpad.net/ceilometer/+spec/power-thermal-data

除了 IPMI 传感器数据和节点管理器基本数据外,添加更多电源和散热数据。这些来自平台硬件的数据独立于操作系统/驱动程序,并且对于显示节点运行状态很有价值。

问题描述

我们已经有了 IPMI 传感器数据和节点管理器基本数据,但它们无法提供数据中心服务器的整体情况的足够信息。可以添加一些额外的数据,例如 CUPS(每秒计算使用率),它指示 CPU/IO/内存利用率,以及体积空气流量,它指示通过服务器的当前空气量。这些数据加上之前的基础电源/散热数据,可以作为 Nova 调度的输入。

提议的变更

在 NodeManager 类中添加获取新数据的能力。添加新的 pollsters 来获取 CUPS 和空气流量数据。

添加以下新指标

名称

类型

单位

来源

hardware.ipmi.airflow

g

CFM

p

hardware.ipmi.cups.core

g

%

p

hardware.ipmi.cups.io

g

%

p

hardware.ipmi.cups.mem

g

%

p

  • g = gauge(仪表), n = notification(通知), p = pollster(轮询器), CFM = 立方英尺/分钟

替代方案

数据模型影响

REST API 影响

安全影响

Pipeline 影响

其他最终用户影响

这些新数据应该通过 Horizon 计量仪表板公开。

性能/可扩展性影响

获取一些新指标不会导致明显的性能下降

其他部署影响

开发者影响

实现

负责人

主要负责人

edwin-zhai

其他贡献者

lianhao-lu

工作项

  • 在 NodeManager 类中添加原始 IPMI 命令以获取新数据

  • 实现 2 个新的 pollster:CUPS 和空气流量

  • 添加单元测试覆盖

  • 更新相关文档

未来生命周期

一旦此功能启用,需要在接下来的 2 个版本中进行测试和错误修复,以避免回归

依赖项

此功能依赖于支持 IPMI/NM 的服务器

测试

此功能与之前的 IPMI 传感器数据和 NM 基本数据需要第三方测试系统来验证其功能。该测试系统的开发正在进行中。

文档影响

添加的指标需要在 测量部分中记录。

参考资料