大数据平台CDH搭建
发表于:2024-11-23 作者:热门IT资讯网编辑
编辑最后更新 2024年11月23日,一、概述Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括H
一、概述
Cloudera版本(Cloudera's Distribution Including Apache Hadoop,简称"CDH"),基于Web的用户界面,支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop,简化了大数据平台的安装、使用难度。
二、安装部署
序号 | IP地址 | 主机名 | 系统版本 |
---|---|---|---|
1 | 172.20.2.222 | cm-server | centos7.3 |
2 | 172.20.2.203 | hadoop-1 | centos7.3 |
3 | 172.20.2.204 | hadoop-2 | centos7.3 |
4 | 172.20.2.205 | hadoop-3 | centos7.3 |
2.2.1 基础环境部署
a.修改主机名配置hosts
systemctl stop firewalldhostnamectl set-hostname cm-server #更改个主机名sed -i 's/SELINUX=enforcing/SELINUX=disable/g' /etc/selinux/configsetenforce 0cat >>/etc/hosts<
b.配置cm-server免密钥登录其他节点
ssh-keygen -t rsa #在cm-server生成密钥对for num in `seq 1 3`;do ssh-copy-id -i /root/.ssh/id_rsa.pub root@hadoop-$num;done
c.在cm-server安装数据库
在cm-server上安装mariadb,用于后期数据存储
yum install mariadb*systemctl start mariadbmysql -uroot password "mysqladmin"登录数据库后我们采用root登录
e.java环境配置
如果系统有安装java环境卸载干净使用oracle的jdk,此处使用jdk-7u80-linux-x64.rpm
,在各节点均配置java环境
rpm -ivh jdk-7u80-linux-x64.rpmcat >/etc/profile.d/java.sh<
f.配置各节点服务器需求
sysctl -w vm.swappiness=10echo "vm.swappiness=10" >>/etc/sysctl.confecho never > /sys/kernel/mm/transparent_hugepage/defragecho never > /sys/kernel/mm/transparent_hugepage/enabled
2.2.2 Cloudera Manager安装
a.下载解压相关软件包
mkdir /software && cd /softwarewget -c https://archive.cloudera.com/cm5/cm/5/cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz wget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcelwget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha1 -O CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.shawget -c http://archive.cloudera.com/cdh6/parcels/5.14.2/manifest.jsonwget -c https://dev.mysql.com/get/Downloads/Connector-J/mysql-connector-java-5.1.46.ziptar -zxvf cloudera-manager-centos7-cm5.14.1_x86_64.tar.gz -C /opt/ #解压cm包unzip mysql-connector-java-5.1.46.zip #解压java-mysql连接jar包cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar /opt/cm-5.14.1/share/cmf/lib/ #将jar包复制到cm的lib目录下cp mysql-connector-java-5.1.46/mysql-connector-java-5.1.46-bin.jar
b.创建用户及初始化数据库
useradd --system --home=/opt/cm-5.14.1/run/cloudera-scm-server/ --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm #在各个节点均创建用户vim /opt/cm-5.14.1/etc/cloudera-scm-agent/config.ini将其中的server_host=cm-server #指向cm-serverusage: /opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh [options] (postgresql|mysql|oracle) database username [password] #使用选项/opt/cm-5.14.1/share/cmf/schema/scm_prepare_database.sh mysql cmdb -h"cm-server" -uroot -pmysqladmin --scm-host cm-server scm scm scm
c.将文件将cm-server修改完成的文件分发到其他各节点
for i in `seq 1 3`;do scp -r /opt/cm-5.14.1 hadoop-$i:/opt/;done
d.创建本地源
mv CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel* manifest.json /opt/cloudera/parcel-repo/
e.启动服务
在cm-server启动server和agent服务,在其他节点启动agent服务
/opt/cm-5.14.1/etc/init.d/cloudera-scm-server start/opt/cm-5.14.1/etc/init.d/cloudera-scm-agent start
2.2.2 Cloudera Manager的web界面配置
服务器均启动后,可以浏览器访问cm-server的7180端口,用户名/密码为admin/admin
接受协议继续
可以选择适用60天
提示一些涉及许可证的信息
勾选管理的主机继续操作
选择CDH-5.14版本
parcel安装
主机正确性检查
群集设置(选择安装的服务)
自定义角色分配,选择安装在那个节点上
数据库设置
需要提前创建数据库及授权其他节点可以正常连接
审核更改
集群安装
完成安装
后期可添加服务