传统的海量数据分析方案(PPT 45页)
所属分类:大数据
文件大小:3342 KB
下载要求:10 学币或VIP
点击下载传统的海量数据分析方案
Apache Hadoop项目
Apache Hadoop
HDFS设计
HDFS体系结构
MapReduce-“分而治之”
聚集查询(SUM、AVG等)
MapReduce
MapReduce执行流程
MapReduce容错
MapReduce容忍节点异构
Yahoo Pig& FaceBook Hive
HIVE体系结构
数据模型
Hive中的数据共享
Hive优点
Hive缺点
Spark
Spark容错
海量日志分析示例
Spark支持的操作
Spark优点
Hive体系结构
Shark体系结构
Stinger/Tez
Tez
Stinger体系结构
Impala
Impala体系结构
Impala支持的数据格式
大数据引擎测试
测试环境
..............................
精品资料网 m.cnshu.cn
Copyright © 2004- 粤ICP备10098620号-1