26 9 月 Hive, 大数据 Posted by 蓝染君 hive-01 基本概念 什么是hive hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表并提供类SQL查询功能。 Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-20 Yarn Yarn资源调度器 yarn是一个资源调度平台,负责为运算程序提供服务器运算资源,相当于一个分布式的操作系统平台,而MapReduce... Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-18 数据清洗 ETL ETL:Extract-Transform-Load 用来描述将数据从来源端警告抽取Extract 转换Transform 加载Load至目的端的过程 Continue reading
26 9 月 Hadoop, 大数据 Posted by 蓝染君 hadoop-17 Join的多种应用 Reduce Join Map端的主要工作,为来自不同表或文件的key/value对,打标签以区别不... Continue reading