首页  

CDH和Apache Hadoop比较     所属分类 bigdata 浏览量 1179
Apache 社区版和第三方发行版本 
考虑到集群部署的高效性,集群的稳定性以及后期集中的配置管理,业界大多使用Cloudera公司的发行版CDH。

  Apache Hadoop社区版本问题
    (1)版本管理比较混乱 
    (2)集群部署配置较为复杂,通常安装集群需要编写大量的配置文件,分发到每一台节点上,容易出错,效率低下
    (3)对集群的监控,运维,需要安装第三方的其他软件,运维难度比较大;
    (4)在Hadoop生态圈中,组件的选择和使用,比如Hive,Mahout,Sqoop,Flume,Spark,Oozie等,需要大量考虑兼容性的问题,经常会浪大量的时间去编译组件,解决版本冲突问题。

  CDH版本的Hadoop的优势在于:
    (1)基于Apache协议,100%开源,版本管理清晰;
    (2)在兼容性,安全性,稳定性上比Apache Hadoop有大幅度的增强;
    (3)运维简单方便,对于Hadoop集群提供管理,诊断,监控,配置更改等功能,使得运维工作非常高效,而且集群节点越来越多,优势越明显。
    (4)CDH提供成体系的文档,很多大公司的应用案例以及商业支持等。



可以选择Cloudera Express免费版本,该版本包含了CDH以及Cloudera Manager核心功能,提供了对集群的管理功能,
比如自动化部署,中心化管理,监控,诊断功能等。另外,Cloudera Express免费版本对集群节点数目是无限制的。
收费的Cloudera Enterprise拥有高级管理功能,如提供商业技术支持,自动化备份和灾难恢复,记录配置历史及回滚等

上一篇     下一篇
币圈925惨案

aerospike集群信息查看

Hadoop2.0 Yarn 概述

hdfs shell 常用命令

hdfs namenode HA 高可用

HDFS Federation 机制