书籍介绍
本书从建模的角度探讨数据挖掘,洞察数据挖掘算法如何工作,并且利用复杂而有强大预测功能的模型进行数据分析。作者用白盒数据挖掘方法代替了盲目的黑盒方法,强调对算法的理解和软件潜在的静态模型结构,带领读者浏览各种不同数据挖掘算法的步骤和微妙之处,使用样本数据集运算,使读者可以清楚地感受到算法的内在原理。同时,本书还提供了许多算法在实际大规模数据集上的应用,给读者提供了一个可以实践的框架。第1章至第6章内容包括:降维方法、回归模型、多元回归和模型建立、逻辑回归、朴素贝叶斯估计和贝叶斯网络、遗传算法等,第7章为案例学习,读者可以将新学习到的数据挖掘专业知识应用在解决实际问题当中去。本书还包括110个章节问题训练,测试不同方面能力,使读者了解其掌握程度。本书不仅可供分析师和管理人员参考,也可用于数据管理的专业人员、数据库分析员和决策者。同时,本书也可作为数据挖掘课程的教学参考书,供高年级本科或研究生参考使用。