26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-20 Yarn Yarn资源调度器 yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce... Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-18 数据清洗 ETL ETL:Extract-Transform-Load 用来描述将数据从来源端警告抽取Extract 转换Transform 加载Load至目的端的过程 Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-17 Join的多种应用 Reduce Join Map端的主要工作,为来自不同表或文件的key/value对,打标签以区别不... Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-15 OutputFormat OutputFormat是MapReduce输出的基类,所有实现MapReduce输出都实现了OutputFormat接口 Outpu... Continue reading