Python数据挖掘入门与实践完整版【高清电子书】
#学习资料 ·2026-01-26 10:44:25
本书是写给那些想把数据挖掘技术应用到实际项目中,却不知道怎么开始的程序员。如果你没有编程经历,我强烈建议你在学习本书之前,至少先了解一下编程的基础知识。本书直接略过这部分内容,也不会把过多精力放在代码的具体实现上。也就是说,简要学习一下编程基础知识再来学习本书就行。本书不对你的编程技能做过高要求,所以你没必要先成为编程高手!

本书主要内容:
第1章开始数据挖掘之旅,介绍我们即将用到的技术,接着通过讲解两个基础算法的实现方法达到热身目的。
第2章用scikit-learn估计器分类,涵盖了数据挖掘的一个重要主题——分类。这一章还会介绍将数据挖掘流程标准化的流水线结构,便于你管理实验流程。
第3章用决策树预测获胜球队,介绍决策树和随机森林两个新算法。我们将通过抽取区分度高的特征来预测获胜选手。
第4章用亲和性分析方法推荐电影,思考根据以往消费记录推荐产品的问题,介绍Apriori算法。
第5章用转换器抽取特征,介绍不同类别特征的抽取方法及不同数据集的处理方法。
第6章使用朴素贝叶斯进行社会媒体挖掘,使用朴素贝叶斯算法自动分析来自社交网站Twitter的文本信息。
第7章用图挖掘找到感兴趣的人,采用聚类和网络分析方法,发现社会媒体上感兴趣的人。
第8章用神经网络破解验证码,从图像中抽取信息,然后训练神经网络,用来发现图像中的单词和字母。
第9章作者归属问题,通过抽取文本特征,使用支持向量机算法,找出文档的作者。
第10章新闻语料分类,使用k-means聚类算法,根据新闻文章内容进行分类。
第11章用深度学习方法为图像中的物体进行分类,采用深度神经网络算法确定图像中的物体。
第12章大数据处理,探讨对大数据进行数据挖掘的流程及方法。附录依次介绍各章的参考资料,便于读者深入了解各章内容。