环境准备
准备3台机器,都进行类似操作,也可以更多台。暂时每台机器16g,也可以先设置成8g。系统centos7。
基础工具、服务器名称
1 | sudo yum install -y vim wget ntp net-tools |
编辑ip和hostname,看自己习惯的方式设置,我是都图形化设置的。
编辑hosts文件,内容如下
1 | 172.16.120.41 cdh01 |
账号权限
账号要求有sudo权限,并且不需要输入密码,如果没有也可以使用root。正常是将账号加入wheel组,则可以sudo。要无密码操作,需要
1 | sudo visudo |
然后根据注释决定如何操作,我这里是将下面一行启用
1 | %wheel ALL=(ALL) NOPASSWD: ALL |
ssh免密
1 | ssh-keygen -t rsa |
然后直接多次回车。
1 | ssh-copy-id cdh01 |
验证 ssh
使用 ssh 命令检查免密是否配置成功
防火墙
关闭防火墙
1 | sudo systemctl stop firewalld.service |
关闭 selinux
1 | sudo vi /etc/selinux/config |
将 SELINUX=enforcing 改为 SELINUX=disabled
设置后需要重启才能生效
时间同步
1 | sudo yum -y install ntp |
1 | sudo vim /etc/ntp.conf |
将时钟服务器更改为如下 4
1 | server 0.cn.pool.ntp.org |
启动时间同步服务
1 | sudo systemctl start ntpd &&sudo systemctl enable ntpd &&sudo ntpdate -u 0.cn.pool.ntp.org &&sudo hwclock --systohc && date |
CDH安装
登陆cdh01。上传安装资料到/home/weblogic/cloudera。
搭建yum源
1 | sudo mkdir -p /var/www/html/ |
访问验证 cdh01/cloudera-manager/
安装 jdk
1 | cd /var/www/html/cloudera-manager/ |
安装 mysql
自己任何方式安装都可以。
安装
1 | sudo yum -y remove mariadb-libs |
启动
1 | sudo systemctl enable mysqld |
登陆 mysql,执行 init.sql 脚本
1 | mysql -uroot -p |
配置 mysql 驱动
1 | sudo mkdir -p /usr/share/java/ |
安装 Cloudera Manager
配置本地 yum 源,新建文件
1 | /etc/yum.repos.d/cloudera-manager.repo |
内容如下
1 | [cloudera-manager] |
使其生效
1 | sudo yum clean all |
安装
1 | sudo yum install -y cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server |
配置本地 Parcel 存储库
1 | sudo mv /home/weblogic/cloudera/parcel/* /opt/cloudera/parcel-repo |
初始化 scm 库
1 | sudo /opt/cloudera/cm/schema/scm_prepare_database.sh mysql scm scm 123456Aa. |
上传 jar 包
在其他 2 台服务器上创建目录并上传 jar 包到该目录
/usr/share/java/mysql-connector-java.jar
启动 CM
1 | sudo systemctl start cloudera-scm-server |
出现 INFO WebServerImpl:com.cloudera.server.cmf.WebServerImpl: Started Jetty server 则启动成功
访问 http://cdh01:7180/
账号密码为 admin/admin
CM初始化
http://cdh01:7180/
账号密码为 admin/admin
然后各种统一、下一步、继续等选项。选择版本时选择使用60天的。
集群安装
随意起名
输入主机名称搜索,可以搜索到3个主机。
选择存储库
http://cdh01/cloudera-manager/
jdk选项
两个全都勾选
输入可以无须密码直接sudo的账号,没有的话就用root。
集群安装最后一步,勾选最后一个选项。
集群设置
选择自定义服务,勾选最下面“包括 Cloudera Navigator”。
选择服务:hbase\hdfs\hive\hue\spark\yarn\zk
角色分配:
hbase:
01;03;03;所有主机。
hdfs:
3;1;1;3;3;所有主机。
hive:
所有主机;1;1;所有主机。
hue:
3;3.
spark:
1;所有主机。
yarn:
1;1;所有主机。
zk:
所有主机。
Cloudera Management Service:
全选1
数据库配置
metastore hive 123456Aa.
amon amon 123456Aa.
rman rman 123456Aa.
nav nav 123456Aa.
navms navms 123456Aa.
hue hue 123456Aa.
后面直接下一步最终完成。也可以自己设置存储目录。