CDH和Apache Hadoop比较
所属分类 bigdata
浏览量 1355
Apache 社区版和第三方发行版本
考虑到集群部署的高效性,集群的稳定性以及后期集中的配置管理,业界大多使用Cloudera公司的发行版CDH。
Apache Hadoop社区版本问题
(1)版本管理比较混乱
(2)集群部署配置较为复杂,通常安装集群需要编写大量的配置文件,分发到每一台节点上,容易出错,效率低下
(3)对集群的监控,运维,需要安装第三方的其他软件,运维难度比较大;
(4)在Hadoop生态圈中,组件的选择和使用,比如Hive,Mahout,Sqoop,Flume,Spark,Oozie等,需要大量考虑兼容性的问题,经常会浪大量的时间去编译组件,解决版本冲突问题。
CDH版本的Hadoop的优势在于:
(1)基于Apache协议,100%开源,版本管理清晰;
(2)在兼容性,安全性,稳定性上比Apache Hadoop有大幅度的增强;
(3)运维简单方便,对于Hadoop集群提供管理,诊断,监控,配置更改等功能,使得运维工作非常高效,而且集群节点越来越多,优势越明显。
(4)CDH提供成体系的文档,很多大公司的应用案例以及商业支持等。
可以选择Cloudera Express免费版本,该版本包含了CDH以及Cloudera Manager核心功能,提供了对集群的管理功能,
比如自动化部署,中心化管理,监控,诊断功能等。另外,Cloudera Express免费版本对集群节点数目是无限制的。
收费的Cloudera Enterprise拥有高级管理功能,如提供商业技术支持,自动化备份和灾难恢复,记录配置历史及回滚等
上一篇
下一篇
币圈925惨案
aerospike集群信息查看
Hadoop2.0 Yarn 概述
hdfs shell 常用命令
hdfs namenode HA 高可用
HDFS Federation 机制