Hadoop构建数据仓库与实战分析

《Hadoop构建数据仓库与实战分析》

本书从Hadoop背景、特性、安装等开始,逐步讲解其配置、解决方案、元数据解析等内容。本书共10章,主要内容包括:Hadoop简介,Hadoop的安装与配置,HDFSHA及解决方案,HDFS元数据解析,Hadoop的元数据备份方案,Hadoop的BackupNode方案,MapReduce设计理念与基本架构,MapReduce编程模型,YARN设计理念与基本架构,YARN基础库。本书可作为高等院校计算机等相关专业的大数据或相关课程的教材,也可供大数据领域的工程技术人员学习、参考。

Hadoop与大数据挖掘

《Hadoop与大数据挖掘》

这是一本适合教学和零基础自学的Hadoop与大数据挖掘的教程,即便你完全没有Hadoop编程基础和大数据挖掘基础,根据本书中的理论知识和上机实践,也能迅速掌握如何使用Hadoop进行大数据挖掘。全书主要分为两篇:基础篇(1-7章),首先从宏观上介绍了大数据相关概念和技术,然后逐一对Hadoop、Hive、HBase、Pig、Spark、Oozie等一系列大数据技术的概念、原理、架构,以及企业应用方法进行了详细介绍,同时配有大量的案例。掌握了这些内容,就具备了大数据技术的基础;挖掘实战篇(8章),主要是一个企业级大数据应用项目——电子商务智能推荐系统。通过分析应用背景、构建系统,使读者了解针对系统的每一层应用使用什么大数据技术来解决问题。涉及的流程有数据采集、数据预处理、模型构建等,在每一个流程中会进行大数据相关技术实践,运用实际数据来进行分析,使读者切身感受到利用大数据技术解决问题的魅力。

Hadoop大数据分析与挖掘实战

《Hadoop大数据分析与挖掘实战》

  10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。  本书共16章,分三个部分:基础篇、实战篇、高级篇。  基础篇(第1~6章),第1章的主要内容是数据挖掘概述、大数据餐饮行业应用;第2章针对大数据理论知识进行基础讲解,简明扼要地对Hadoop安装、原理等做了介绍;第3章介绍了大数据仓库Hive的安装、原理等内容;第4章介绍了大数据数据库HBase的安装、原理等内容;第5章介绍了几种大数据挖掘建模平台,同时重点介绍了本书使用的开源TipDM-HB大数据挖掘平台;第6章对数据挖掘的建模过程,各种挖掘建模的常用算法与原理及其在大数据挖掘算法库Mahout的实现原理进行了介绍。  实战篇(第7~14章),重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述大数据时代针对大数据的分析方法与过程,最后完成模型构建的顺序进行,对建模过程等关键环节进行了详细的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。  高级篇(第15~16章),介绍了基于Hadoop大数据开发的相关技术以及开发步骤,同时使用实例来展示这些步骤,使读者可以自己动手实践,亲自体会开发的乐趣;同时,还介绍了基于TipDM-HB大数据挖掘平台的二次开发实例,借助TipDM-HB大数据挖掘平台二次开发工具,可以更加快捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地体会到大数据分析与挖掘的强大魅力。  图书配套提供原始样本数据文件、相关代码及教学用PPT等。

从零开始学Hadoop大数据分析

《从零开始学Hadoop大数据分析》

本书全面介绍了Hadoop大数据分析的基础知识、14个核心组件模块及4个项目实战案例。为了帮助读者高效、直观地学习,作者特意为本书录制了20小时同步配套教学视频。本书共19章,分为3篇。第1篇Hadoop基础知识,涵盖大数据概述、Hadoop的安装与配置、Hadoop分布式文件系统及基于Hadoop3的HDFS高可用等相关内容;第2篇Hadoop核心技术,涵盖的内容有Hadoop的分布式协调服务——ZooKeeper;分布式离线计算框架——MapReduce;Hadoop的集群资源管理系统——YARN;Hadoop的数据仓库框架——Hive;大数据快速读写——HBase;海量日志采集工具——Flume;Hadoop和关系型数据库间的数据传输工具——Sqoop;分布式消息队列——Kafka;开源内存数据库——Redis;Ambari和CDH;快速且通用的集群计算系统——Spark。第3篇Hadoop项目案例实战,主要介绍了基于电商产品的大数据业务分析系统、用户画像分析、基于个性化的视频推荐系统及电信离网用户挽留4个项目实战案例,以提高读者的大数据项目开发水平。本书内容全面,实用性强,适合作为Hadoop大数据分析与挖掘的入门读物,也可作为Java程序员的进阶读物。另外,本书还特别适合想要提高大数据项目开发水平的人员阅读。对于专业的培训机构和相关院校而言,本书也是一本不可多得的教学用书。

Hadoop安全 大数据平台隐私保护

《Hadoop安全 大数据平台隐私保护》

  《Hadoop安全大数据平台隐私保护》阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大部分:第一部分是安全架构,第二部分是验证、授权和安全审计,第三部分是数据安全,第四部分是归纳总结。最后介绍了几个使用案例,融合了书中诸多概念。  《Hadoop安全大数据平台隐私保护》适合对Hadoop感兴趣的读者,有大数据平台保护需求的读者。

Hadoop海量数据处理 技术详解与项目实战(第2版)

《Hadoop海量数据处理 技术详解与项目实战(第2版)》

本书介绍了Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和总结篇。基础篇详细介绍了Hadoop、YARN、MapReduce、HDFS、Hive、Sqoop和HBase,并深入探讨了Hadoop的运维和调优;应用篇则包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现;结束篇对全书进行总结,并对技术发展做了展望。

Hadoop应用开发基础

《Hadoop应用开发基础》

Hadoop是一个分布式系统的基础架构,支持对大量数据进行分布式处理,能以高效、可靠的方式完成数据处理。本书围绕Hadoop生态圈技术进行讲解,主要包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、Oozie工作流调度系统等内容。本书以Linux操作系统为平台,紧密结合实际应用,贯穿了大量实践案例。另外,本书配以多元的学习资源和平台服务,包括参考教案、案例素材下载、学习交流社区等,为读者提供全方位的学习体验。通过系统地学习本书内容和操作实践,读者可以掌握大数据相关技能。本书适合作为高等学校计算机专业大数据等相关课程的教材使用,也适合具有一定Linux、Java开发经验且想从事大数据开发工作的人员自学使用,还适合作为大数据分析与运维人员的参考用书。

Hadoop虚拟化

《Hadoop虚拟化》

本书旨在帮助读者了解和掌握不同虚拟化Hadoop选择的优缺点、虚拟化Hadoop的配置及其注意事项。本书共分15章,主要内容包括Hadoop平台在企业转型中扮演的重要角色、Hadoop基础概念、YARN与HDFS、现代数据平台、数据采集、HadoopSQL引擎、Hadoop中的多租户、虚拟化基础、虚拟化Hadoop实践、虚拟化Hadoop、虚拟化Hadoop主服务器、虚拟化Hadoop工作节点、私有云中的Hadoop即服务、Hadoop安装以及HadoopLinux配置。

Hadoop数据分析

《Hadoop数据分析》

通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。本书分为两大部分,*一部分从非常高的层次介绍分布式计算,讨论如何在集群上运行计算;*二部分则重点关注数据科学家应该了解的工具和技术,意在为各种分析和大规模数据管理提供动力。

Hadoop数据仓库实战

《Hadoop数据仓库实战》

本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验。在此基础上,本书通过丰富的练习和操作实践,帮助读者巩固所学的内容。本书配以多元的学习资源和支持服务,包括视频、案例素材、学习社区等,为读者提供全方位的学习体验。本书适合作为计算机、大数据等相关专业的教材,也适合具有一定Linux或Java开发基础且想从事大数据开发的人员阅读学习,还可以作为大数据分析与运维人员的参考用书。

Hadoop实战手册

《Hadoop实战手册》

  这是一本Hadoop实用手册,主要针对实际问题给出相应的解决方案。《Hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍Hadoop数据导入导出、HDFS的概述、Pig与Hive的使用、ETL和简单的数据处理,还介绍了MapReduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍Hadoop的部署的各种模式、添加新节点、退役节点、快速恢复、MapReduce调优等。  《Hadoop实战手册》适合各个层次的Hadoop技术人员阅读。通过阅读《Hadoop实战手册》,Hadoop初学者可以使用Hadoop来进行数据处理,Hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,Hadoop系统管理员可以更好地进行日常运维。《Hadoop实战手册》也可作为一本Hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。

Hadoop权威指南:大数据的存储与分析(第4版)

《Hadoop权威指南:大数据的存储与分析(第4版)》

  本书结合理论和实践,由浅入深,全方位介绍了Hadoop这一高性能的海量数据处理和分析平台。全书5部分24章,第Ⅰ部分介绍Hadoop基础知识,主题涉及Hadoop、MapReduce、Hadoop分布式文件系统、YARN、Hadoop的I/O操作。第Ⅱ部分介绍MapReduce,主题包括MapReduce应用开发;MapReduce的工作机制、MapReduce的类型与格式、MapReduce的特性。第Ⅲ部分介绍Hadoop的运维,主题涉及构建Hadoop集群、管理Hadoop。第Ⅳ部分介绍Hadoop相关开源项目,主题涉及Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ部分提供了三个案例,分别来自医疗卫生信息技术服务商塞纳(Cerner)、微软的人工智能项目ADAM(一种大规模分布式深度学习框架)和开源项目Cascading(一个新的针对MapReduce的数据处理API)。  本书是一本专业、全面的Hadoop参考书和工具书,阐述了Hadoop生态圈的新发展和应用,程序员可以从中探索海量数据集的存储和分析,管理员可以从中了解Hadoop集群的安装和运维。

Hadoop平台搭建与应用

《Hadoop平台搭建与应用》

本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop 2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言精练、通俗易懂等特点,可作为高等院校大数据应用专业、软件技术专业、云计算技术与应用专业的教材,也可作为从事大数据分析、云计算应用等工作的技术人员的参考用书。

Hadoop理论与实践/大数据人工智能系列丛书

《Hadoop理论与实践/大数据人工智能系列丛书》

  《Hadoop理论与实践/大数据人工智能系列丛书》按照高等学校大数据、人工智能课程基本要求,以案例驱动的形式来组织内容,突出该课程的实践性特点。  《Hadoop理论与实践/大数据人工智能系列丛书》主要包含四大部分:Hadoop技术、数据仓库与Hive、Flume分布式日志处理系统、Spark及其生态圈概述。其中,Hadoop技术包括大数据与数据分析、Hadoop生态系统介绍、Hadoop存储、Hadoop计算之MapReduce、Hadoop安全等;数据仓库与Hive包括Hive与数据库的基础知识、Hive的高级特性、Hive优化及案例的应用;Flume分布式日志处理系统包括Flume介绍、Flume使用案例及Flume开发案例的应用;Spark及其生态圈概述包括Spark简介及Spark生态系统详解。  《Hadoop理论与实践/大数据人工智能系列丛书》内容安排合理,层次清晰,通俗易懂,实例丰富,突出理论与实践的结合,可作为各类高等院校人工智能与大数据相关专业的教材,也可供广大程序设计人员参考。

Hadoop集群程序设计与开发

《Hadoop集群程序设计与开发》

本书主要内容包括:第1章初识Hadoop、第2章Hadoop基础、第3章Hadoop开发环境配置与搭建、第4章Hadoop分布式文件系统(HDFS)、第5章资源管理器(Yarn)、第6章MapReduce基础程序设计、第7章MapReduce程序设计、第8章分布式数据库HBase、第9章分布式数据仓库Hive、第10章项目测试与发布

Cloudera Hadoop大数据平台实战指南

《Cloudera Hadoop大数据平台实战指南》

对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。本书的切入点明确而清晰,从Hadoop生态系统的明星Cloudera入手,逐步引出各类大数据基础和核心应用框架。本书分为18章,系统介绍Hadoop生态系统大数据相关的知识,包括大数据概述、ClouderaHadoop平台的安装部署、HDFS分布式文件系统、MapReduce计算框架、资源管理调度框架YARN、Hive数据仓库、数据迁移工具Sqoop、分布式数据库HBase、ZooKeeper分布式协调服务、准实时分析系统Impala、日志采集工具Flume、分布式消息系统Kafka、ETL工具Kettle、Spark计算框架等内容,最后给出两个综合实操案例,以巩固前面所学的知识点。本书既适合Hadoop初学者、大数据技术工程师和大数据技术爱好者自学使用,亦可作为高等院校和培训机构大数据相关课程的培训用书。

Hadoop大数据挖掘从入门到进阶实战(视频教学版)

《Hadoop大数据挖掘从入门到进阶实战(视频教学版)》

本书采用“理论+实战”的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。本书共分为13章,涵盖的主要内容有:集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程——使用SQL提交MapReduce任务到Hadoop集群;游戏玩家的用户行为分析——特征提取;Hadoop平台管理与维护;Hadoop异常处理解决方案;初识Hadoop核心源码;Hadoop通信机制和内部协议;Hadoop分布式文件系统剖析;ELK实战案例——游戏应用实时日志分析平台;Kafka实战案例——实时处理游戏用户数据;Hadoop拓展——Kafka剖析。本书不但适合刚入门的初学者系统学习Hadoop的各种基础语法和开发技巧,而且也适合有多年开发经验的开发者进阶提高。另外,本书也适合社会培训机构和相关院校作为教材或者教学参考书。

Hadoop大数据实战权威指南(第2版)

《Hadoop大数据实战权威指南(第2版)》

基于"深入分析组件原理、充分展示搭建过程、详细指导应用开发”的理念,以*新版Hadoop及其生态组件为对象,采用理论与应用高度融合的方法,介绍大数据的概念、技术、方法、应用、以及项目开发。全书分为三篇,第一篇为大数据的基本概念和技术综述,第二篇为平台搭建与基本应用,内容设计Linux、HDFS、MapReduce、Yarn、Hive、HBase、Sqoop、Kafka、Spark、Phoenix等;第三篇为数据处理与项目开发,综合运用各类组件进行实际数据处理,包括交互式应用、决策、推荐算法、销售数据分析系统等。

Hadoop大数据开发实战

《Hadoop大数据开发实战》

本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(HadoopDistributedFileSystem)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运行机制、HadoopI/O流操作;第7~10章是初识MapReduce编程模型、MapReduce应用编程开发、MapReduce编程案例、MapReduce运行机制与YARN平台;第11章是汽车销售数据统计分析项目实战。本书将理论与实践相结合,介绍了大数据的核心技术,并通过介绍一个企业的开发项目,深入讲解大数据技术在实际工作中的应用。本书是为所有热爱大数据、打算从事大数据相关工作的读者而编写的,适合有Java编程基础的学习者参考使用,也适合作为高等院校、培训机构的大数据技术教材。

Hadoop大数据开发基础

《Hadoop大数据开发基础》

本书以任务为导向,较为全面地介绍了Hadoop大数据技术的相关知识。全书共6章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce编程入门、MapReduce进阶编程、项目案例:电影网站用户性别预测。本书的2~5章包含了实训与课后练习,通过练习和操作实践,帮助读者巩固所学的内容。本书可以作为高校大数据技术类专业的教材,也可作为大数据技术爱好者的自学用书。

Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材

《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》

  《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》作为Hadoop的入门教材,采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。它将帮助您:  ·使用Hadoop分布式文件系统(HDFS)来存储海量数据集,通过MapReduce对这些数据集进行分布式计算。  ·使用HadoopYARN资源管理器统一管理和调度Hadoop资源。  ·熟悉Hadoop的数据和I/O构件,用于压缩、数据集成、序列化和持久处理。  ·洞悉编写MapReduce实际应用时的常见陷阱和高级特性。  ·设计、构建和管理一个专用的Hadoop集群或在云上运行Hadoop。  ·使用高级查询语言Pig来处理大规模数据。  ·利用Hadoop数据库HBase来保存和处理结构化/半结构化数据。  ·利用HIVE数据仓库工具对Hadoop文件中的数据集进行数据整理、特殊查询和分析存储。  ·利用SqoopSqoop在关系数据库以及Hadoop数据存储和处理平台进行数据导入、导出。  ·学会利用ZooKeeper来构建分布式系统。  ·学会利用Ambari来构建、管理、监控Hadoop生态的集群。  《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》直接将相关行业典型案例作为实验教学内容编入,展示了如何用Hadoop解决实际行业场景中的问题,对实际操作更有针对性。《Hadoop大数据技术与应用/大数据专业应用型人才培养规划教材》可作为高等院校数据科学与大数据技术、计算机、信息管理等相关专业的大数据入门教材。

Hadoop大数据技术开发实战

《Hadoop大数据技术开发实战》

本书以Hadoop及其周边框架为主线,介绍了整个Hadoop生态系统主流的大数据开发技术。全书共16章,第1章讲解了VMware中CentOS7操作系统的安装;第2章讲解了大数据开发之前对操作系统集群环境的配置;第3~16章讲解了Hadoop生态系统各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和数据实时处理系统Flume、Kafka、Storm、Spark以及分布式搜索系统Elasticsearch等的基础知识、架构原理、集群环境搭建,同时包括常用的Shell命令、API操作、源码剖析,并通过实际案例加深对各个框架的理解与应用。通过阅读本书,读者即使没有任何大数据基础,也可以对照书中的步骤成功搭建属于自己的大数据集群并独立完成项目开发。本书可作为Hadoop新手入门的指导书,也可作为大数据开发人员的随身手册以及大数据从业者的参考用书。

Hadoop大数据分析实战

《Hadoop大数据分析实战》

本书详细阐述了与Hadoop3大数据分析相关的基本解决方案,主要包括Hadoop简介、大数据分析概述、基于MapReduce的大数据处理、Python-Hadoop科学计算和大数据分析、R-Hadoop统计数据计算、ApacheSpark批处理分析、ApacheSpark实时数据分析、ApacheFlink批处理分析、ApacheFlink流式处理、大数据可视化技术、云计算简介、使用亚马Web服务等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。

Hadoop大数据处理技术基础与实践(第2版)(微课版)

《Hadoop大数据处理技术基础与实践(第2版)(微课版)》

全书共有12章,从Hadoop概述开始,介绍了Hadoop的安装与配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、HadoopI/O操作、海量数据库技术HBase、ZooKeeper技术、分布式数据仓库技术Hive、分布式数据分析工具Pig,以及数据迁移工具Sqoop,最后对大数据实时处理技术做了简单介绍,旨在让读者了解当前其他的大数据处理技术。本书除了介绍Hadoop的理论外,还介绍了如何使用各组件,但因为只是介绍基础的使用,没有涉及底层的高级内容,所以本书只是起引导作用,旨在让读者了解Hadoop并能够使用Hadoop的基本功能,并不是学习Hadoop的完全手册。本书适合作为高等院校、高等职业院校大数据、物联网、云计算及其他计算机相关专业的教材,也可供云计算与大数据技术相关的培训班使用。

Hadoop大数据解决方案

《Hadoop大数据解决方案》

  Hadoop开源且基于Java、儿乎没有入门障碍,它提供了迅速占据市场的实用人数据解决办案。《Hadoop大数据解决方案》由包括己认证Hadoop开发者、Committers和峰会演讲者在内的专家团队编写,可以作为有关该框架流程和功能的自学教程。书中单独介绍了各个组件,最后用实际项目将它们联系起来并构建示例应用。  《Hadoop大数据解决方案》跳过数据库开发基础知识,直奔主题,帮助有经验的开发者快速上手,并开始在真实场景中使用Hadoop。  《Hadoop大数据解决方案》向你展示使用HadoopStack配置存储、用户体验和内存计算的方法。  《Hadoop大数据解决方案》解释使用Kafka实时消息和Storm数据流将Hadoop与其他系统集成的方法。  《Hadoop大数据解决方案》演示关键安全特性与技术,同时给出保证数据安全的专家建议。  《Hadoop大数据解决方案》讲授使用ApacheBigTop打包、测试和配置的基础知识,以及使用Ignite快速执行MapReduce的方法。  《Hadoop大数据解决方案》带你领略示例应用构建过程,展示核心组件如何协同工作,同时提供了所有示例代码。

Hadoop大数据解决方案/大数据应用与技术丛书

《Hadoop大数据解决方案/大数据应用与技术丛书》

使用Hadoop构建更优秀的大数据解决方案  Hadoop开源且基于Java、几乎没有入门障碍,它提供了迅速占据市场的实用大数据解决方案。《Hadoop大数据解决方案》由包括已认证Hadoop开发者、Committers和峰会演讲者在内的专家团队编写,可以作为有关该框架流程和功能的自学教程。书中单独介绍了各个组件,*后用实际项目将它们联系起来并构建示例应用。本书跳过数据库开发基础知识,直奔主题,帮助有经验的开发者快速上手,并开始在真实场景中使用Hadoop。主要内容◆向你展示使用HadoopStack配置存储、用户体验和内存计算的方法◆解释使用Kafka实时消息和Storm数据流将Hadoop与其他系统集成的方法◆演示关键安全特性与技术,同时给出保证数据安全的专家建议◆讲授使用ApacheBigTop打包、测试和配置的基础知识,以及使用Ignite更快速执行MapReduce的方法◆带你领略示例应用构建过程,展示核心组件如何协同工作,同时提供了所有示例代码

Hadoop应用实战

《Hadoop应用实战》

  本书全面地讲述了Hadoop相关领域的重要知识和*的技术及应用。书中首先介绍了数据挖掘的基础知识、Hadoop的基本框架和相关信息,然后系统地描述了如何在各类行业中用好Hadoop来做数据挖掘。  本书面向的主要读者人群是想了解Hadoop与大数据的技术人员,无论他们是在互联网企业,还是在传统企业;无论他们从事的是技术或者运维工作,专业做数据分析,还是企业的策略官、市场官和运营官,都能从本书中找到各自所需要的内容。  本书可以帮助读者开阔眼界和找到方法,让他们知道如何分析实际商业场景和业务问题,构建基于Hadoop的大数据系统,通过使用数据运营,对公司业务运营带来直接的效益。当然对于学生、教师和有志于从业大数据运营的人员来说,也是一本实用的教材。

Hadoop构建数据仓库实践

《Hadoop构建数据仓库实践》

  本书讲述在流行的大数据分布式存储和计算平台Hadoop上设计实现数据仓库,将传统数据仓库建模与SQL开发的简单性与大数据技术相结合,快速、高效地建立可扩展的数据仓库及其应用系统。  本书内容包括数据仓库、Hadoop及其生态圈的相关概念,使用Sqoop从关系数据库全量或增量抽取数据,使用HIVE进行数据转换和装载处理,使用Oozie调度作业周期性执行,使用Impala进行快速联机数据分析,使用Hue将数据可视化,以及数据仓库中的渐变维(SCD)、代理键、角色扮演维度、层次维度、退化维度、无事实的事实表、迟到的事实、累积的度量等常见问题在Hadoop上的处理等。  本书适合数据库管理员、大数据技术人员、Hadoop技术人员、数据仓库技术人员,也适合高等院校和培训机构相关专业的师生教学参考。

Elasticsearch集成Hadoop最佳实践

《Elasticsearch集成Hadoop最佳实践》

  ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。ElasticsearchHadoop作为一个完美的工具,用来连接Elasticsearch和Hadoop的生态系统。通过Kibana技术,ElasticsearchHadoop很容易从Hadoop生态系统中获得大数据分析的结果。  本书全面介绍ElasticsearchHadoop技术用于大数据分析以及数据可视化的方法。内容共分7章,包括Hadoop、Elasticsearch、Marvel和Kibana安装;通过编写MapReduce作业,把Hadoop数据导入Elasticsearch;全面分析Elasticsearch本质,如全文本搜索分析、查询、筛选器和聚合;使用Kibana创建各种可视化和交互式仪表板,并使用Storm和Elasticsearch分类现实世界的流数据以及相关的其他主题。  本书适合从事大数据分析人员、大数据应用开发的人员参考,也适合高等院校及培训机构相关专业的师生教学参考。

微信公众号

热门文章

更多