?Fayson的github: https://github.com/fayson/cdhproject
推薦關注微信公眾號:「Hadoop實操」,ID:gh_c4c535955d0f,或者掃描文末二維碼。
1 文檔編寫目的
本文檔講述如何升級Cloudera Manager和CDH,通過本文檔,您將學習到以下知識:
1.如何對Cloudera Manager進行停機升級
2.如何對CDH進行停機升級
3.如何在不影響集羣作業的情況下進行CDH滾動升級
文檔主要分為以下幾步:
1.Cloudera升級概述
2.Minor版本Cloudera Manager和CDH升級
3.Maintenance版本滾動升級CDH
4.滾動升級時進行任務驗證
5.集羣升級完成後功能驗證
這篇文檔將重點介紹CDH升級,並基於以下假設:
1.CDH5.4.3環境已搭建並正常運行
2.集羣服務(CM、HBase、HDFS、Hive、Hue、Oozie、Spark、Yarn、Zookeeper)
3.Cloudera Manager使用rpm安裝
4.CDH使用parcels安裝
5.集羣未配置Kerberos
以下是本次測試環境,但不是本操作手冊的硬限制:
1.操作系統:Redhat6.5
2.舊CM/CDH版本:CM5.4.3/ CDH5.4.3
3.目標CM/CDH的升級版本:CM5.11.1/ CDH5.11.1
4.採用sudo許可權的ec2-user用戶進行操作
升級建議:
1.針對CDH的Maintenance Version升級,可以使用滾動升級,比如:5.4.x升級到5.4.y,這種版本升級主要修復bug,不改動API,也不涉及新的功能。
2.針對CDH的Minor Version升級,建議停機升級或者滾動升級(如果跨度不大),比如5.x.x升級到5.y.y,這種版本升級主要是增加新的功能和新的API。
3.針對CDH的Major Version升級,建議必須停機升級,而且在升級前需要對已有應用和作業的改造和升級進行完備的測試驗證,相應升級時停機時間會較長,這種版本升級一般是Hadoop相關組件的大版本升級,可能會改動API。
2 Cloudera升級概述
下面描述的流程適用於由Cloudera Manager管理的集羣,對於不是由Cloudera Manager管理的集羣升級,請參考:Upgrading Unmanaged CDH Using the Command Line
你可以使用tarballs或operating system packages來升級Cloudera Manager,然後使用packages或parcels來升級CDH。同時有可能還需要安裝一個新版JDK。升級Cloudera Manager的同時Cloudera Navigator也會被升級。
CDH和Cloudera Manager不用同時升級,但是需要保證Cloudera Manager和CDH版本的兼容。Cloudera Manager可以管理當前或以前的major版本的CDH,或相同minor版本的CDH,或較低minor版本的CDH。比如,Cloudear Manager 5.7.1可以管理CDH5.7.2,CDH5.6.1和CDH4.8.6,但是不能管理CDH5.8.1. Cloudera Manager5.x不能管理CDH3.x。
升級時具體有如下幾種選擇: