书籍内容
《Hive性能调优实战》旨在介绍如何进行Hive性能调优,以及调优时所涉及的工具。书中重点介绍了Hive性能调优所涉及的Hadoop组件和Hive工具。考虑到很多调优方法的着眼点有一定的相似性,这些调优方法可以适用于多个Hive版本,所以《Hive性能调优实战》在介绍Hive的相关内容时会穿插Hive 1.x、Hive 2.x及Hive 3.x等多个版本的内容。
《Hive性能调优实战》共11章,涵盖的内容如下:
举例感受Hive性能调优的多样性
Hive问题排查与调优思路
环境搭建
Hive及其相关大数据组件
深入MapReduce计算引擎
Hive SQL执行计划
Hive数据处理模式
YARN日志
数据存储
发现并优化Hive中的性能问题
Hive知识体系总结
《Hive性能调优实战》内容实用,非常适合对大数据技术感兴趣的读者阅读,尤其是Hive进阶读者。另外,《Hive性能调优实战》还适合IT培训机构的大数据培训学员和高校相关专业的学生阅读。
编辑推荐
适读人群 :Hive初学者、Hive进阶读者、 大数据开发工程师、大数据开发项目经理、专业培训机构的学员、高校相关专业的学生。
重点介绍了Hive性能调优所涉及的Hadoop组件和Hive工具
站在工程的角度介绍Hive性能调优,注重调优方法的可落地性
从语法、表模型设计、执行计划和计算引擎等多个角度进行讲解
注重实例演示和调优方法的总结,给出近百个实例带领读者实际操练
适用于Hive 1.x、Hive 2.x及Hive 3.x等多个版本
《Hive性能调优实战》核心内容:
举例感受Hive性能调优的多样性
Hive问题排查与调优思路
环境搭建
Hive及其相关大数据组件
深入MapReduce计算引擎
Hive SQL执行计划
Hive数据处理模式
YARN日志
数据存储
发现并优化Hive中的性能问题
Hive知识体系总结
超值赠送:
《Hive性能调优实战》源代码文件(需要下载)作者简介
林志煌 曾在中国互联网头部公司长期从事大数据相关项目的研发。擅长并能够熟练使用Hive、MapReduce和Spark等大数据相关技术。经手过日数据流量TB级别和总量PB级别的Hadoop大数据平台建设。从事过数据采集、数据清洗、数据仓库模型构建及数据产品研发等工作,涵盖了数据生命周期的主要阶段。