更新时间:2025-04-02 16:31:06
封面
版权信息
内容提要
大数据核心技术系列编委会
序言
前言
智慧教材使用方法
第1章 Hive入门
任务1 了解Hive基础
1.1.1 认识Hive
1.1.2 Hive架构设计
1.1.3 Hive工作流程
1.1.4 Hive适用场景
任务2 掌握Hive数据存储模型
1.2.1 Hive存储格式
1.2.2 Hive数据单元
1.2.3 Hive存储模型
任务3 安装配置Hive环境
1.3.1 Hive的发展历程
1.3.2 搭建Hive CDH环境
1.3.3 Hive初体验
1.3.4 Hive开发环境
1.3.5 技能实训
本章小结
本章作业
第2章 Hive数据库及表操作
任务1 熟悉Hive数据类型
2.1.1 基本数据类型
2.1.2 复杂数据类型
任务2 使用Hive管理雇员信息
2.2.1 Hive DDL操作
2.2.2 Hive DML操作
2.2.3 Hive Shell
2.2.4 技能实训
任务3 使用Hive Java API操作雇员表
2.3.1 开发环境搭建
2.3.2 JDBC操作Hive数据库
2.3.3 技能实训
第3章 Hive元数据
任务1 访问雇员数据的元数据信息
3.1.1 Hive元数据的概念及存储方式
3.1.2 雇员数据元数据信息查询
3.1.3 技能实训
任务2 使用Hive Java API读取雇员表元数据
3.2.1 hive-metastore组件
3.2.2 使用HiveMetaStoreClient访问元数据
3.2.3 技能实训
任务3 使用HCatalog管理雇员数据的元数据
3.3.1 HCatalog介绍
3.3.2 HCatalog应用
第4章 Hive高级操作
任务1 关联查询零售商店订单明细
4.1.1 SELECT语句
4.1.2 关联查询
4.1.3 联合查询
4.1.4 技能实训
任务2 使用分组排序实现商品销售排行
4.2.1 排序
4.2.2 分组聚合
4.2.3 技能实训
任务3 使用窗口函数实现零售数据统计
4.3.1 窗口函数
4.3.2 窗口的定义
4.3.3 技能实训
第5章 Hive函数与Streaming
任务1 应用内置函数
5.1.1 函数概述
5.1.2 内置函数详解
5.1.3 技能实训
任务2 使用Java编写Hive自定义函数
5.2.1 自定义函数概述
5.2.2 UDF
5.2.3 UDAF
5.2.4 UDTF
5.2.5 技能实训
任务3 使用Streaming实现数据处理
5.3.1 Streaming概念
5.3.2 Streaming应用
5.3.3 技能实训
第6章 Hive视图与索引
任务1 创建并管理零售商店的顾客表和订单表视图
6.1.1 视图的基本概念及使用场景
6.1.2 视图的基本操作
6.1.3 Materialized Views和Lateral View
6.1.4 技能实训
任务2 建立零售商店顾客表索引
6.2.1 Hive索引的基本概念及使用场景
6.2.2 为零售商店顾客表建立索引
6.2.3 与索引相关的元数据表
6.2.4 技能实训