大小:27.78M
更新时间:23-08-28
系统:Pc
数据挖掘:概念模型方法和算法(第2版)是一本数据挖掘原理讲解书籍,由[美]坎塔尔季奇Mehmed Kantardzic著,王晓海,吴志刚共同翻译。全书讲解了DBSCAN、BIRCH和分布式DBSCAN的聚类算法,介绍了贝叶斯网络,并讨论了图形中的Betweeness和Centrality参数测量算法,分析在建立决策树时使用的cart算法和基尼指数,讨论relief以及pagerank算法,更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容等等,能够适用于在校生,毕业生,研究人员阅读。
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念模型方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。
本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败
1.7 本书结构安排
1.8 复习题
1.9 参考书
第2章 数据准备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标准化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.6 异常点分析
2.7 复习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特征归约
3.2.1 特征选择
3 .2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量
3.5 主成分分析
3.6 值归约
3.7 特征离散化ChiMerge技术
3.8 案例归约
3.9 复习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.2 统计学习原理
4.3 学习方法的类型
4.4 常见的学习任务
4.5 支持向量机
4.6 kNN:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%准确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 复习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.4 预测回归
5.5 方差分析
5.6 对数回归
5.7 对数-线性模型
5.8 线性判别分析
5.9 复习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 C4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 C4.5算法:生成决策规则
6.6 CART算法和Gini指标
6.7 决策树和决策规则的局限性
6.8 复习题
6.9 参考书目
第7章 人工神经网络
7.1 人工神经元的模型
7.2 人工神经网络的结构
7.3 学习过程
7.4 使用ANN完成的学习任务
7.4.1 模式联想
7.4.2 模式识别
7.5 多层感知机
7.6 竞争网络和竞争学习
7.7 SoM
7.8 复习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.2 多学习器组合方案
8.3 bagging和boosting
8.4 AdaBoost算法
8.5 复习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 DBSCAN箅法
9.7 BIRCH算法
9.8 聚类验证
9.9 复习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 Apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高Apriori算法的效率
10.5 FP增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 复习题
10.9 参考书目
第11章 Web挖掘和文本挖掘
11.1Web挖掘
11.2 Web内容、结构与使用挖掘
11.3 HITS和LOGSOM算法
11.4 挖掘路径遍历模式
11.5 PageRank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 复习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
第13章 遗传算法
第14章 模糊集和模糊逻辑
第15章 可视化方法
附录A 数据挖掘工具
附录B 数据挖掘应用
应用信息
同类热门
类似软件
数据挖掘技术与工程实践25.09M190人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看
SPSS Modeler 181.78G5251人在用 SPSS Modeler 18是一款数据挖掘和文本分析软件,可用于构建预测模型和进行高级数据分析。在这次版本中,带来了大量实用功能,内置性能更加强大的大数据算法,支持的平台更加广泛(包括Windows10)。 除此之外,SPSS Mod
查看热门标签
网友评论1人参与,1条评论
最新排行
佳能550d使用说明书10.57Mpdf高清版 本次小编分享的是佳能550d使用说明书,压缩包内还附带了佳能550d摄影技巧,方便那些拥有该相机却不知如何正常使用的朋友进行学习。 佳能550d则是佳能公司位于2010年2月8日发布了新的单反数码相机,新产品重点包括1080p高清(带全
查看
从零开始学电路基础pdf版30.87M 从零开始学电路基础是2007年由国防工业出版社出版的一本电路基础图书,主编刘建清,全书就是为了初学者从零开始,快速掌握电路基础知识而编写的。主要内容包括:电路的基本定律、定理和基本分析方法,磁场与磁路,交流电路,互感与变压器,电路的过渡过程等内容。
查看
领域驱动设计与模式实战63.82M尼尔森(Jimmy Nilsson)高清扫描版 领域驱动设计与模式实战是一本将企业应用架构模式和领域驱动设计两大名著精髓的实战演练书籍,由瑞典程序员尼尔森(Jimmy Nilsson)编著。全书内容丰富翔实,将Martin Fowler企业应用架构模式和Eric Evans领域驱动设计两部经典名
查看
windows程序设计第7版中文版14.84M电子版 windows程序设计第7版中文版是专门为国内的Windows开发人员而提供的一个pdf电子版学习文件,同时由于这是国外一名作者进行编写分享的,因此原著是纯英文的,但为了更好的满足国人们的学习需求,所以小编带来的是经过专业团队进行翻译的一个简体中文
查看
ASP.NET Web API设计134.82Mpdf扫描版 ASP.NET Web API设计是一本设计面向多客户端的可演化Web API的指南,由美国程序员布洛克和西布拉奥编著,全书内容丰富,提供了及时而全面的指南,帮助人们使用ASP.NET Web API构建坚实的系统,书本以ASP.NET Web A
查看
html5秘籍第2版107.18Mpdf扫描版HTML5不仅仅是一种标记语言,它还指代多种独立的Web标准。但是如何才能学习html5的全部知识呢?小编推荐用户使用html5秘籍第2版,这是一本HTML5语言的学习指导书籍,由美国程序员Matthew MacDonald编著。本书内容丰富,由浅入深,
查看
c++从入门到精通(第2版)156.72M明日科技pdf扫描版 c++从入门到精通第2版是一本c++编程语言的入门书籍,由明日科技C程序开发团队组织编写数十名程序员编著。本书内容由浅入深,循序渐进,以初中级程序员为对象,先从C语言基础学起,再学习C语言的程序结构,然后学习C语言的高级应用,最后学习开发一个完整的
查看
cprimerplus第六版300M史蒂芬·普拉达pdf中文版 C++ Primer Plus 第6版 中文版是由美国加州肯特菲尔得的马林学院教授Stephen Prata编写出的C语言教材,是C语言的超集。本书根据2003年的ISO/ANSI C++标准编写,通过充分吸收大量短小精悍的程序详细而全面地阐述了C
查看
sql必知必会第4版677Kpdf高清版SQL是使用最为广泛的数据库语言,但想要学习并且使用好并不容易。为此小编带来了sql必知必会第4版,pdf文档格式,全书由浅入深地讲解了SQL的基本概念和语法,涉及数据的排序、过滤和分组,以及表、视图、联结、子查询、游标、存储过程和触发器等内容,实例丰富
查看
3500常用字草书字帖4.46Mpdf高清版本款3500常用字草书字帖是一本pdf高清版的钢笔草书字帖图书,非常的清晰,罗列出了常用的3500个汉字,可用于临摹,并且具有操作简单而便捷,特点明显的优势,如果需要练字的用户快来试试这款“3500常用字草书字帖”到电脑上进行学习练字吧。
查看
第1楼 河南省新乡市移动 网友