大数据与分布式计算培训教材(PPT 65页)
所属分类:大数据
文件大小:4553 KB
下载要求:10 学币或VIP
点击下载HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(Divide and Conquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive QL – Join
Hive QL – Join in Map Reduce
Spark
Spark生态系统
Spark任务处理流程
Spark SQL
Spark Streaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
精品资料网 m.cnshu.cn
Copyright © 2004- 粤ICP备10098620号-1