书籍内容
Hadoop是一个分布式系统的基础架构,支持对大量数据进行分布式处理,能以高效、可靠的方式完成数据处理。本书围绕Hadoop生态圈技术进行讲解,主要包括Hadoop环境配置、Hadoop分布式文件系统(HDFS)、Hadoop分布式计算框架MapReduce、Hadoop资源调度框架YARN与Hadoop新特性、Hadoop分布式数据库HBase、Oozie工作流调度系统等内容。
本书以Linux操作系统为平台,紧密结合实际应用,贯穿了大量实践案例。另外,本书配以多元的学习资源和平台服务,包括参考教案、案例素材下载、学习交流社区等,为读者提供全方位的学习体验。通过系统地学习本书内容和操作实践,读者可以掌握大数据相关技能。
本书适合作为高等学校计算机专业大数据等相关课程的教材使用,也适合具有一定Linux、Java开发经验且想从事大数据开发工作的人员自学使用,还适合作为大数据分析与运维人员的参考用书。
编辑推荐
1、选取知识点核心实用,以互联网+实现终身学习
2、以企业需求为设计导向,以任务驱动为讲解方式
3、以案例为主线组织知识点,以实战项目来提升技术
4、充分考虑学习者的认知曲线,由浅入深,边讲边练作者简介
刘雯,任教于北京邮电大学电子工程学院,主要研究方向为室内外高精度定位技术及位置服务。主持国家重点研发计划课题和国家国家自然科学基金面上项目各1项,主持完成国家863课题1项;获得国家科技发明二等奖和国家科技进步二等奖各1项,教育部、中国电子学会、中国通信学会等省部级奖励7项指导学生参加全国研究生电子设计大赛赛获得初赛一等奖;在国际期刊及相关专业国际会议发表学术论文30余篇。