Hadoop, 大数据
Posted by

hadoop-10 MapReduce

MapReduce定义 是一个分布式运算程序的编程框架,是用户开发基于hadoop的数据分析应用的核心框架 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序,并运行在一个hadoop集群上 优点: ...
Hadoop, 大数据
Posted by

hadoop-04 hdfs

HDFS定义 hdfs是一个文件系统,用于文件存储,通过目录树来定位文件 是分布式的 适合一次写入,多次读出的场景 优点: 高容错性 数据自动保存多个副本,通过增加副本的形式提高容错性 某个副本丢失后,可以自动恢复 ...