大数据与分布式计算介绍(PPT 65页)
所属分类:大数据
文件大小:1339 KB
下载要求:10 学币或VIP
点击下载大数据与分布式计算
HDFS
常用RAID技术
HDFS系统架构
什么是HDFS?
HDFS设计目标
不适合HDFS的场景
设计目标
HDFS主要组件的功能
文件
分而治之(DivideandConquer)
MapReduce
MapReduce:大规模数据处理
MapReduce特性
WordCount
Hive
HiveQL–Join
HiveQL–JoininMapReduce
了解Hive的意义
Hive架构
Hive执行流程
Hive操作符
Hive编译器
Spark
Spark生态系统
Spark任务处理流程
SparkSQL
SparkStreaming
GraphX
Tachyon
Spark架构
Spark的基本组件。
Spark运行逻辑
..............................
精品资料网 m.cnshu.cn
Copyright © 2004- 粤ICP备10098620号-1