缩容MRS集群_MapReduce服务 MRS_华为云

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

急躁的吐司 · 缩容MRS集群_MapReduce服务 ...· 1 月前 ·

文质彬彬的野马 · 如何处理计算实例启动失败报错Python不存 ...· 1 年前 ·

冷静的鞭炮 · 实验5 ...· 1 年前 ·

酒量大的风衣 · 配置HBase备份_MapReduce服务 ...· 1 年前 ·

千杯不醉的路灯 · 9. 分布式服务 · ...· 1 年前 ·

近视的卡布奇诺 · 连接串行化· 3 月前 ·

知识渊博的打火机 · Canon : imagePROGRAF ...· 9 月前 ·

细心的荒野 · 港城宁波哪些国际化学校，学费，课程如何，速速 ...· 1 年前 ·

纯真的松球 · error C2227: ...· 1 年前 ·

爱热闹的葫芦 · 北京交通大学交通运输学院· 1 年前 ·

目前支持缩容Core节点和Task节点，不支持缩容Master节点。对集群进行缩容时，只需要在界面调整节点个数，MRS会自动选择缩容节点，完成缩容任务。

自动选择缩容节点的策略如下：

不允许缩容安装了基础组件（Zookeeper，DBService，KrbServer，LdapServer等）的节点，MRS不会选择这些节点进行缩容。因为这些基础组件是集群运行的基础。

Core节点是存放集群业务数据的节点，在缩容时必须保证待缩容节点上的数据被完整迁移到其他节点，即完成各个组件的退服之后，才会执行缩容的后续操作（节点退出Manager和删除ECS等）。在选择Core节点时，会优先选择存储数据量较小，且可退服实例健康状态良好的节点，避免节点退服失败。例如在分析集群上，Core节点安装了DataNode，缩容时会优先选择DataNode存储数据量较小且健康状态良好的节点。

Core节点在缩容的时候，会对原节点上的数据进行迁移。业务上如果对数据位置做了缓存，客户端自动刷新位置信息可能会影响时延。缩容节点可能会影响部分HBase on HDFS数据的第一次访问响应时长，可以重启HBase或者对相关的表Disable/Enable来避免。

Task节点本身不存储集群数据，属于计算节点，不存在节点数据迁移的问题。因此在选择Task节点时，优先选择健康状态为故障、未知、亚健康的节点进行缩容。这些节点实例的健康状态信息可以在MRS上的“实例”管理界面查看。

缩容校验策略

缩容节点选择完成后，为了避免组件退服失败，不同组件提供了不同的退服约束规则，只有满足了所有安装组件的退服约束规则才允许缩容。缩容校验策略如表1 所示。

规则：缩容后节点数不小于当前HDFS的副本数且HDFS数据总量不超过缩容后HDFS集群总容量的80%，可以执行缩容操作。

原因：确保缩容后剩余空间足够存放现有数据，并预留一部分空间。

为了保证数据的可靠性，HDFS中每保存一个文件则自动生成1个备份文件，即默认共2个副本。

登录MRS管理控制台。

选择“现有集群”，选中一个运行中的集群并单击集群名称，进入集群信息页面。

选择“节点管理”页签，在需要缩容的节点组的“操作”列，单击“缩容”，进入缩容集群页面。

只有运行中的集群且集群中的节点都在运行中才能进行该操作。

“缩容类型”选择“指定数量缩容”。

设置 “缩容节点数量” ，并单击 “确定” 。

缩容中：集群正在缩容时集群状态为 “缩容中” 。已提交的作业会继续执行，也可以提交新的作业，但不允许继续缩容和删除集群，也不建议重启集群和修改集群配置。

缩容成功：集群缩容成功后集群状态为 “运行中” ，计费按照缩容后所使用的资源计算。

缩容失败：集群缩容失败时集群状态为 “运行中” 。用户可以执行作业，也可以重新进行缩容操作。

缩容成功后，可以在集群详情的“节点管理”页签查看集群的节点信息。

指定节点缩容

当节点不再需要时，使用该功能删除节点。删除节点前建议先对组件的角色实例执行退服操作，并且请确保节点中的数据已完成备份。缩容ClickHouseServer实例节点请参考缩容ClickHouseServer节点。缩容指定节点仅支持缩容按需计费类型的节点。如需缩容包周期计费类型的节点，请参考退订MRS包周期集群指定节点进行操作。

登录MRS控制台。

单击集群名称进入集群详情页面。

单击“节点管理”。

单击对应节点组“操作”列的“缩容”，进入缩容页面。

“缩容类型”选择“指定节点缩容”，勾选待缩容节点。

处于“关机”、“失联”、“未知”、“已隔离”及“故障”状态的节点可以被指定缩容。若节点无法勾选，请单击“跳转关机”进入ECS页面将对应节点关机，并在MRS集群详情页面单击“告警管理”，观察关机后是否有影响业务的告警出现，若无影响业务的告警则回到缩容页面选择对应的节点进行缩容，若有影响业务的告警请处理告警后再进行缩容。

节点缩容存在数据丢失风险，建议在缩容前进行节点退服操作，具体操作请参见退服和入服MRS角色实例。

图1 缩容指定节点

勾选“我已经阅读上述信息，并了解具体影响。”并单击“确定”。

单击“组件管理”观察各个组件是否存在异常，若存在异常等待5~10分钟后再次观察组件，依然存在异常则联系华为云技术支持处理。

单击“告警管理”观察是否存在异常告警，若存在请清除告警后再进行其他操作。