Apache Kylin权威指南

《Apache Kylin权威指南》

  本书第1章介绍ApacheKylin的历史、技术原理和产品定位,帮助用户了解何时和为何使用Kylin。第2章通过一个具体的案例快速入门,讲解Kylin核心概念、Cube建模和SQL连接查询这些基本使用。第3、4章讲解增量构建和进一步的流式构建,是大多数案例典型配置。第5、6章是针对查询和可视化、Cube调优的两个专门章节,适合较高级的用户。第7章是一系列有行业特点的具体案例分析,贯穿之前的所有概念。第8、9章讲ApacheKylin的扩展和企业级高级功能,技术性较强,会有较多的代码示例。第10章讲运维管理,从安装配置、监控维护到常见的问题和修复。全书后两章谈ApacheKylin开源社区和项目发展规划。

Apache Kylin权威指南(第2版)

《Apache Kylin权威指南(第2版)》

ApacheKylin是由中国人主导的Apache项目,是Hadoop大数据平台上的一个开源OLAP引擎,将大数据的查询速度和并发性能提升百倍以上,为超大规模数据集上的交互式大数据分析打开了大门。本书由ApacheKylin核心开发团队编写,系统地介绍了ApacheKylin安装、入门、调优、可视化、运维管理、流式计算、Spark构建、扩展开发、跟主流云平台的集成,以及经典案例等各个方面,是系统学习ApacheKylin的优秀材料。第1章和第2章是基本概念和快速入门,为初学者打下坚实基础。第3章和第4章介绍基本的Cube优化手段和增量构建。第5章展示丰富的查询接口和其上的可视化能力。第6章介绍了基于CubePlanner的自动优化的核心算法和原理。第7章是进阶的流式准实时构建,以将构建的批次间隔缩短到分钟级。第8章介绍如何使用Spark进行Cube构建,以及如何调优性能。第9章通过介绍若干Kylin的重点案例,以帮助读者理解Kylin的使用场景和重要价值。第10章介绍可扩展架构和二次开发接口,适合高级开发者。第11章则介绍企业级功能、用户的认证和授权相关知识。第12章着重于问题的排查诊断、日常的运维管理,以及如何通过社区获得帮助等内容。第13章分别以AWS,微软Azure和阿里云为例,介绍如何在主流云平台上部署和使用Kylin。第14章说明如何参与和贡献到开源项目。最后的第15章,介绍了ApacheKylin的未来发展方向。

Hive性能调优实战

《Hive性能调优实战》

《Hive性能调优实战》旨在介绍如何进行Hive性能调优,以及调优时所涉及的工具。书中重点介绍了Hive性能调优所涉及的Hadoop组件和Hive工具。考虑到很多调优方法的着眼点有一定的相似性,这些调优方法可以适用于多个Hive版本,所以《Hive性能调优实战》在介绍Hive的相关内容时会穿插Hive1.x、Hive2.x及Hive3.x等多个版本的内容。《Hive性能调优实战》共11章,涵盖的内容如下:举例感受Hive性能调优的多样性Hive问题排查与调优思路环境搭建Hive及其相关大数据组件深入MapReduce计算引擎HiveSQL执行计划Hive数据处理模式YARN日志数据存储发现并优化Hive中的性能问题Hive知识体系总结《Hive性能调优实战》内容实用,非常适合对大数据技术感兴趣的读者阅读,尤其是Hive进阶读者。另外,《Hive性能调优实战》还适合IT培训机构的大数据培训学员和高校相关专业的学生阅读。

Hive编程指南

《Hive编程指南》

  《Hive编程指南》是一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法——HiveQL来汇总、查询和分析存储在Hadoop分布式文件系统上的大数据集合。《Hive编程指南》通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,演示Hive如何在Hadoop生态系统进行工作。  《Hive编程指南》适合对大数据感兴趣的爱好者以及正在使用Hadoop系统的数据库管理员阅读使用。

Hive实战

《Hive实战》

Hive“出身名门”,是最初由Facebook公司开发的数据仓库工具。它简单且容易上手,是深入学习Hadoop技术的一个很好的切入点。本书由数据库专家和大数据专家共同撰写,具体内容包括:Hive的安装和配置,其核心组件和架构,Hive数据操作语言,如何加载、查询和分析数据,Hive的性能调优以及安全性,等等。本书旨在为读者打牢基础,从而踏上专业的大数据处理之旅。

Hive编程

《Hive编程》

  你是否需要把一个关系型数据库应用迁移到Hadoop上?卡普里奥罗等著的《Hive编程(影印版)》这本全面的指南将为你介绍ApacheHive,它是Hadoop的数据仓库平台。你将快速了解如何使用Hive的SQL方言——HiveQL——来汇总、查询和分析存储在Hadoop分布式文件系统中的大数据集。  《Hive编程(影印版)》为你展数据库应用于示了如何在你的环境中搭建和配置Hive,它也提供了对Hadoop和MapReduce的概括介绍,并且演示了Hive是如何在Hadoop的生态系统中工作的。你还将在其中找到现实世界的实例分析,它们展示了那些使用Hive的公司是如何解决PB容量数据层面上的独特问题。

Hive编程技术与应用

《Hive编程技术与应用》

  《Hive编程技术与应用》通过原理加案例的方式系统地讲解了Hive编程技术,使读者能够全面地了解使用Hive的开发流程。书中精心安排了Hive的原理分析、架构特点、环境搭建、HiveQL使用等内容,给出了大量的开发案例及其开发过程,使读者对Hive开发有直观的印象。  全书共10章:前6章系统讲解Hive工作原理、特点,Hive架构,HiveQL表操作,HiveQL数据操作,HiveQL查询,Hive安装与配置,Hive自定义函数;第8~10章是综合案例部分,通过案例帮助读者掌握整个大数据项目的开发流程,包括数据清洗、数据处理、数据导入导出。本书知识结构简单明了,案例生动具体,内容设计新颖,思路清晰。  《Hive编程技术与应用》不仅可作为普通高校大数据相关专业的教材,也可以作为想继续深入了解大数据编程的读者的参考书,还可作为各类相关培训班的培训教材。

Hive数据仓库技术与应用

《Hive数据仓库技术与应用》

本书是大数据技术与应用专业校企合作系列教材之一,采用模块化的编写思路,内容包括Hive概述、环境准备、Hadoop搭建和配置、安装Hive的基础操作、HiveQL的数据定义、HiveQL语句、Hive综合应用7个单元和25个教学任务。每个单元通过学习目标引出单元的教学核心内容,明确教学任务。每个任务的编写分为任务目标、知识学习、任务实施、同步训练4个环节。最后通过单元小结回顾每个单元的学习重点。本书适合作为高职院校软件技术、大数据技术及应用专业,以及计算机类相关专业的教材,也可以作为Hive爱好者的参考用书。

微信公众号

热门文章

更多