剑客
关注科技互联网

Hadoop MapReduce 进阶

课程简介

MapReduce 是一个高性能的批处理分布式计算框架,用于对海量数据进行并行分析和处理。与传统数据仓库和分析技术相比,MapReduce 适合处理各种类型的数据,包括结构化、半结构化和非结构化数据。数据量在 TB 和 PB 级别,在这个量级上,传统方法通常已经无法处理数据。MapReduce 将分析任务分为大量的并行 Map 任务和 Reduce 汇总任务两类。

核心内容:

1.Hadoop RPC

2.Hadoop 序列化

3.ToolRunner 运行 MapReduce

4.MapReduce On YARN 源码分析

软件环境:Centos6.4,Hadoop2.7.1

是否提供资料:是

课程等级:高级

适合人群:

具有 Linux 基础

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址