大数据生态系统技术

Hadoop2.6（新版本）----MapReduce工作原理

最近在研究Hadoop 发现网上的一些关于Hadoop的资料都是以前的1 X版本的包括MapReduce的工作原理都是以前的一些过时了的东西所以自己重新整理了一些新2 X版本的MapReduce的工作原理下面我画了一张图便于理解M

大数据与云计算 大数据生态系统技术 Hadoop MapReduce yarn

Shuffle过程详解 Shuffle过程是MapReduce的核心最近看了很多资料网上说法大体相同但有些地方有一点点出入就是各个阶段的执行顺序总个shuffle过程可以看做是从map输出到reduce输入的这个中间过程在这个中

大数据与云计算 大数据生态系统技术 Hadoop

首先看看思维导图我的spark是1 6 1版本 jdk是1 7版本 spark是什么 Spark是基于内存计算的大数据并行计算框架 Spark基于内存计算提高了在大数据环境下数据处理的实时性同时保证了高容错性和高可伸缩性允许用户将S

大数据与云计算 spark 大数据生态系统技术