书籍内容
本书是Python数据分析入门书,每个概念都通过简单实例来阐述,便于读者理解与上手。具体内容包括:Python及Pandas基础知识,加载和查看数据集,Pandas的DataFrame对象和Series对象,使用matplotlib、seaborn和Pandas提供的绘图方法为探索性数据分析作图,连接与合并数据集,处理缺失数据,清理数据,转换数据类型,处理字符串,应用函数,分组操作,拟合及评估模型,正则化方法与聚类技术等。
编辑推荐
Python强大易用,是数据处理和数据分析利器,而众多库的加持令其如虎添翼。Pandas就是其中一个非常流行的开源库,它可以确保数据的准确性,将数据可视化,还可以高效地操作大型数据集。借助它,Python可以快速地自动化和执行几乎任何数据分析任务。
本书细致讲解了Pandas的基础知识和常见用法,通过简单的实例展示了如何使用Pandas解决复杂的现实问题,以及如何利用matplotlib、seaborn、statsmodels和sklearn等库辅助进行Python数据分析,涵盖了数据处理、数据可视化、数据建模等内容。此外,本书还简单介绍了Python数据分析生态系统。
***读者评论
“这本书比我读过的其他介绍Pandas的书好很多,别的书也不错,但这本书更简明扼要。作者先介绍方法,接着给出示例,然后继续推进,非常适合学习。”
“这本书令人耳目一新,讲解没有陷入无关紧要的细节和冗长的理论,而是直截了当地介绍如何精通Pandas(以及seaborn和其他库),还涵盖了数据科学的基础(整理数据、可视化等)。”
“我读过许多介绍Pandas的书、博客和论文,这本书格外出众,它讲解清晰,示例丰富,讨论也很有层次:先整体概述,再逐渐深入······一些困扰了我很久的问题在这本书中得到了解答。”作者简介
丹尼尔·陈(Daniel Y. Chen)
Lander Analytics公司数据科学家,Software Carpentry和Data Carpentry的讲师和课程维护人员,DataCamp的课程讲师。目前他在弗尼吉亚理工大学社会与决策分析实验室从事政策决策数据分析。