书籍内容
主要内容
·使用Drill来清洗、准备和汇总原始数据供后期分析使用。
·对日志文件、Parquet文件、JSON和其他复杂的数据文件进行查询。
·使用标准SQL对Hadoop、关系型数据库、MongoDB和Kafka进行查询。
·通过各种编程语言访问Drill。
·使用Drill分析各种结构复杂或存在二义性的数据。
·通过自定义函数扩展Drill的功能,完成复杂的分析任务。
·为网络安全、图片元数据或机器学习数据提供分析能力。
作者简介
Charles Givre是Apache Drill的PMC成员,他是德意志银行中央安全办公室的首席数据科学家。他致力于培养数据科学家并教授数据分析技能,为此他还合伙创办自己的培训公司GTK Cyber。他在全球各种会议和高校教授上述主题的内容。
Paul Rogers是Apache Drill的PMC成员,他专注于Drill的执行引擎开发,同时也是一位数据库和BI方面的软件架构师。他曾经在Cloudera、MapR、Oracle、Actuate和Informix工作。