Yearly Archives: 2023
hive-09 压缩和存储
Hadoop压缩配置
MR支持的压缩编码
压缩格式算法文件扩展名是否可切分DEFLATEDEFLATE.deflate否GzipDEFLATE.gz否bzip2bzip2.bz2是LZOLZO.lzo是SnappySnappy.snappy否
为了支持...
hive-08 函数
系统内置函数
查看系统自带的函数
show functions
显示自带的函数的用法
desc function upper
详细显示自带的函数的用法
desc function extend upper
函数类型
UDF ...
hive-03 数据类型
基本数据类型
字符串"2020-01-01" 进行日期操作 会自动转换日期类型进行操作
String类型 相当于数据库中的varchar 理论上可以存储2GB的字符数
允许任意层次的嵌套
定义Array需要定义元素之间分隔符...
hive-02 安装
安装Hive
hive3版本和hive2版本没有多大变化,主要是适用hadoop3
解压apache-hive-3.1.2-bin.tar.gz到/opt/module/目录下
修改apache-hive-3.1.2-bin文件夹名为hive-3.1...
hive-01 基本概念
什么是hive
hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表并提供类SQL查询功能。
本质:将HQL转化成MapReduce程序
Hive处理的数据存储在HDFS上
Hive分析数据底层的实现是MapRedu...