Python无监督机器学习最佳实践

《Python无监督机器学习最佳实践》

  • 出版社:清华大学出版社
  • ISBN:9787302557685
  • 版次:1
  • 商品编码:12961802
  • 品牌:清华大学出版社(TsinghuaUniversityPress)
  • 包装:平装
  • 开本:16开
  • 出版时间:2020-07-01
  • 用纸:胶版纸
  • 页数:373
  • 字数:490000
  • 正文语种:中文
基本介绍书籍目录点评信息
  • 书籍内容

      《Python无监督机器学习最佳实践》详细阐述了与无监督机器学习开发相关的基本解决方案,主要包括聚类、分层聚类、邻域聚类方法和DBSCAN、降维和PCA、自动编码器、t分布随机邻域嵌入算法、主题建模、购物篮分析、热点分析等内容。此外,《Python无监督机器学习最佳实践》还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。  《Python无监督机器学习最佳实践》适合作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。

    编辑推荐

    在没有标签数据的情况下,无监督学习是一种有效且实用的解决方案。
    本书将指导读者完成使用Python进行无监督学习的最佳实践,以结合使用无监督学习技术和Python库从非结构化数据中提取有意义的信息。本书首先说明了基本聚类如何在数据集中查找相似的数据点。精通k均值算法及其操作原理后,读者将了解什么是降维(Dimensionality Reduction)以及在哪里应用。随着学习的深入,读者还将掌握各种神经网络技术以及了解如何通过它们改善自己的模型。在研究无监督学习的应用程序时,我们还将学习如何挖掘Twitter上流行的主题。开发人员可以通过进行各种有趣的活动来挑战自己(例如,进行购物篮分析以确定不同产品之间的关系),从而完成本书的学习。
    学习完本书,读者将具备使用Python自信地构建自己的模型所需的技能。

    作者简介

    探讨Python环境下的无监督机器学习。
  • 第1章 聚类1.1 简介1.2 无监督学习与有监督学习1.3 聚类的识别1.3.1 识别聚类1.3.2 二维数据1.3.3 练习1:识别数据中的聚类1.4 关于k均值聚类1.4.1 无数学k均值演练1.4.2 对于k均值聚类的深度演练1.4.3 替代距离度量——曼哈顿距离1.4.4 更深的维度1.4.5 练习2:用Python计算欧几里得距离1.4.6 练习3:以距离的概念形成聚类1.4.7 练习4:从头开始实现k均值1.4.8 练习5:通过优化实现k均值1.4.9 聚类性能:轮廓分数1.4.10 练习6:计算轮廓分数1.4.11 活动1:实现k均值聚类1.5 小结第2章 分层聚类2.1 介绍2.2 聚类刷新2.3 分层的组织结构2.4 分层聚类简介2.4.1 执行分层聚类的步骤2.4.2 分层聚类的演练示例2.4.3 练习7:建立分层结构2.5 链接2.5.1 链接概述2.5.2 活动2:应用链接标准2.6 凝聚分层聚类与分裂分层聚类2.6.1 练习8:使用scikit-learn实现凝聚分层聚类2.6.2 活动3:比较k均值和分层聚类2.7 关于k均值与分层聚类2.8 小结第3章 邻域聚类方法和DBSCAN3.1 介绍3.1.1 聚类方法3.1.2 作为邻域的聚类3.2 关于DBSCAN3.2.1 DBSCAN深度3.2.2 DBSCAN算法的演练3.2.3 练习9:评估邻域半径大小的影响3.2.4 DBSCAN属性——邻域半径3.2.5 活动4:从头开始实现DBSCAN3.2.6 DBSCAN属性——最少点3.2.7 练习10:评估最少点阈值的影响3.2.8 活动5:比较DBSCAN与k均值和分层聚类3.3 DBSCAN与k均值和分层聚类3.4 小结第4章 降维和PCA4.1 介绍4.1.1 降维的定义4.1.2 降维的应用4.1.3 维数的诅咒4.2 降维技术4.2.1 概述……第5章 自动编码器第6章 t分布随机邻域嵌入算法第7章 主题建模第8章 购物篮分析第9章 热点分析附录
微信公众号

热门文章

更多