CDH HBase 支持

https://blueprints.launchpad.net/sahara/+spec/cdh-hbase-support

本规范建议在 Sahara 的 CDH 插件中添加 HBase 支持。

问题描述

当前 cdh 插件中没有 HBase 支持,但 Cloudera Manager 支持在集群中安装此服务。HBase 是一种非关系型分布式数据库模型,可以为 Hadoop 提供类似 BigTable 的功能。应该在 Sahara cdh 插件中支持此服务。

提议的变更

该实现将支持 CDH 5.0.0。支持特性

  • 使用 cm-api 在 CDH 集群中安装 HBase 进程

  • 必须先选择并在集群中启动 Zookeeper

  • 支持集群中的 HMaster 和多个 HRegion 进程

  • 支持 CDH 集群中的大多数配置参数

替代方案

数据模型影响

REST API 影响

其他最终用户影响

最终用户需要在节点组模板中选择 HMaster 和 HRegion 进程。

部署者影响

开发者影响

Sahara-image-elements impact

需要在 cdh 镜像中安装必要的 HBase 包。

Sahara-dashboard / Horizon 影响

实现

负责人

主要负责人

lu huichun

其他贡献者

weiting-chen

工作项

可以将工作项划分为几个部分

  • 通过 Cloudera Manager (CM) 调查 CDH 集群中的 HBase 服务

  • 利用 CM-API 客户端调用函数通过 CM 安装 Zookeep

  • 测试和评估概念

  • 在 Sahara cdh 插件中实现源代码

  • 测试代码

依赖项

Zookeeper 进程必须首先在集群中安装。HBase 需要使用 Zookeeper 服务。

测试

编写单元测试以基本测试配置。还需要与集群创建进行集成测试。

文档影响

在列表中添加 HBase 并添加更多关于配置的信息。

参考资料