书籍内容
Apache Kylin 是由中国人主导的Apache项目,是Hadoop大数据平台上的一个开源 OLAP 引擎,将大数据的查询速度和并发性能提升百倍以上,为超大规模数据集上的交互式大数据分析打开了大门。本书由 Apache Kylin 核心开发团队编写,系统地介绍了 Apache Kylin 安装、入门、调优、可视化、运维管理、流式计算、Spark 构建、扩展开发、跟主流云平台的集成,以及经典案例等各个方面,是系统学习Apache Kylin的优秀材料。
第1章和第2章是基本概念和快速入门,为初学者打下坚实基础。第3章和第4章介绍基本的 Cube 优化手段和增量构建。第5章展示丰富的查询接口和其上的可视化能力。第6章介绍了基于 Cube Planner 的自动优化的核心算法和原理。第7章是进阶的流式准实时构建,以将构建的批次间隔缩短到分钟级。第8章介绍如何使用 Spark 进行 Cube 构建,以及如何调优性能。第9章通过介绍若干 Kylin 的重点案例,以帮助读者理解 Kylin 的使用场景和重要价值。第10章介绍可扩展架构和二次开发接口,适合高级开发者。第11章则介绍企业级功能、用户的认证和授权相关知识。第12章着重于问题的排查诊断、日常的运维管理,以及如何通过社区获得帮助等内容。第13章分别以AWS,微软 Azure 和阿里云为例,介绍如何在主流云平台上部署和使用 Kylin。第14章说明如何参与和贡献到开源项目。最后的第15章,介绍了 Apache Kylin 的未来发展方向。
编辑推荐
适读人群 :1、各行业的数据分析师、数据挖掘师、BI、数据仓库相关技术人员;2、各行业的运营人员,运营专家;3、各行业的各级管理者,高层管理者,数据化运营战略的制订者,推动者。
1. 本书内容紧扣热点: Apache Kylin是大数据时代的宠儿,是业界目前实现了秒级别交互式大数据分析的开源技术,数仓OLAP霸主。
2. 内容全面,广度和深度兼顾。不仅是国内关于Apache Kylin 的全面技术书,还融入了对于新特性和功能的讲解。
3. 作者是Apache Kylin的创始团队。
4. 实战性强。本书从入门开始,深入浅出,包含众多实际大数据分析案例,让技术落地解决实际问题。作者简介
本书在2016年一稿撰写的时候,Kylin核心团队刚刚加入新成立的Kyligence 公司,一切从头开始,当时把写书当作了头等大事,整个六人团队都参与了其中:韩卿、李栋、李扬、马洪宾、史少锋、仲俭,署名“Apache Kylin 核心团队”。三年后,Kyligence 已经发展到一百多人;在更新第二版的时候,更多年轻小伙伴加入了进来,包括新Kylin Committer/contributor 陈志雄、龙超、翟娜、孙宇婕;BI 专家:何京珂、汤雪;解决方案专家冯礼、李森辉、宗正;技术支持工程师周丁倩,以及市场部美女编辑符云霞等;此外还有许多同事参与了书稿的审阅。他们都义务将自己的业余时间贡献出来,历时数月完成书稿的更新、修正和校对。
——史少锋,Kyligence 首席架构师,Apache Kylin committer & PMC Chair