书籍内容
本书详细阐述了与Spark实时大数据分析以及Spark Streaming框架相关的基本解决方案,主要包括大数据漫游指南,实时RDD,高速流:链接外部数据源,边界效应,实时ETL和分析技术,大规模机器学习,云、Lambda及Python等内容。此外,本书还提供了丰富的示例以及代码,以帮助读者进一步理解相关方案的实现过程。
本书适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
编辑推荐
每天有100万次优步打车,每月有100亿小时的Netflix视频,每年有1万亿美元花在电子商务网站上——我们今天的生活何尝不是如此呢?。这些服务的成功得益于大数据和日益增长的实时分析。这些服务的成功也应引起我们足够的重视!这也是我们学习实时大数据分析的1佳时机!学习它,掌握它,使用它!本书采取用例为先的方法:每1章都专门针对某一特定垂直行业,并通过实例、代码、图标进行分析——真实的示例、真实的应用程序、真实的数据和真实的代码。