大小:27.78M
更新时间:23-08-28
系统:Pc
数据挖掘:概念模型方法和算法(第2版)是一本数据挖掘原理讲解书籍,由[美]坎塔尔季奇Mehmed Kantardzic著,王晓海,吴志刚共同翻译。全书讲解了DBSCAN、BIRCH和分布式DBSCAN的聚类算法,介绍了贝叶斯网络,并讨论了图形中的Betweeness和Centrality参数测量算法,分析在建立决策树时使用的cart算法和基尼指数,讨论relief以及pagerank算法,更详细地讲解数据挖掘技术商业、隐私、安全和法律方面的内容等等,能够适用于在校生,毕业生,研究人员阅读。
随着数据集规模和复杂度的持续上升,分析员必须利用更高级的软件工具来执行间接的、自动的智能化数据分析。《数据挖掘:概念模型方法和算法(第2版)》介绍了通过分析高维数据空间中的海量原始数据来提取用于决策的新信息的尖端技术和方法。本书开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最前沿的挖掘方法和算法。本书还着重描述如何恰当地选择方法和数据分析软件并合理地调整参数。每章末尾附有复习题。
本书主要用作计算机科学、计算机工程和计算机信息系统专业的研究生数据挖掘教材,高年级本科生或具备同等教育背景的读者也完全可以理解本书的所有主题。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第1章 数据挖掘的概念
1.1 概述
1.2 数据挖掘的起源
1.3 数据挖掘过程
1.4 大型数据集
1.5 数据仓库
1.6 数据挖掘的商业方面:为什么数据挖掘项目会失败
1.7 本书结构安排
1.8 复习题
1.9 参考书
第2章 数据准备
2.1 原始数据的表述
2.2 原始数据的特性
2.3 原始数据的转换
2.3.1 标准化
2.3.2 数据平整
2.3.3 差值和比率
2.4 丢失数据
2.5 时间相关数据
2.6 异常点分析
2.7 复习题
2.8 参考书目
第3章 数据归约
3.1 大型数据集的维度
3.2 特征归约
3.2.1 特征选择
3 .2.2 特征提取
3.3 Relief算法
3.4 特征排列的熵度量
3.5 主成分分析
3.6 值归约
3.7 特征离散化ChiMerge技术
3.8 案例归约
3.9 复习题
3.10 参考书目
第4章 从数据中学习
4.1 学习机器
4.2 统计学习原理
4.3 学习方法的类型
4.4 常见的学习任务
4.5 支持向量机
4.6 kNN:最近邻分类器
4.7 模型选择与泛化
4.8 模型的评估
4.9 90%准确的情形
4.9.1 保险欺诈检测
4.9.2 改进心脏护理
4.10 复习题
4.11 参考书目
第5章 统计方法
5.1 统计推断
5.2 评测数据集的差异
5.3 贝叶斯定理
5.4 预测回归
5.5 方差分析
5.6 对数回归
5.7 对数-线性模型
5.8 线性判别分析
5.9 复习题
5.10 参考书目
第6章 决策树和决策规则
6.1 决策树
6.2 C4.5算法:生成决策树
6.3 未知属性值
6.4 修剪决策树
6.5 C4.5算法:生成决策规则
6.6 CART算法和Gini指标
6.7 决策树和决策规则的局限性
6.8 复习题
6.9 参考书目
第7章 人工神经网络
7.1 人工神经元的模型
7.2 人工神经网络的结构
7.3 学习过程
7.4 使用ANN完成的学习任务
7.4.1 模式联想
7.4.2 模式识别
7.5 多层感知机
7.6 竞争网络和竞争学习
7.7 SoM
7.8 复习题
7.9 参考书目
第8章 集成学习
8.1 集成学习方法论
8.2 多学习器组合方案
8.3 bagging和boosting
8.4 AdaBoost算法
8.5 复习题
8.6 参考书目
第9章 聚类分析
9.1 聚类的概念
9.2 相似度的度量
9.3 凝聚层次聚类
9.4 分区聚类
9.5 增量聚类
9.6 DBSCAN箅法
9.7 BIRCH算法
9.8 聚类验证
9.9 复习题
9.10 参考书目
第10章 关联规则
10.1 购物篮分析
10.2 Apriori算法
10.3 从频繁项集中得到关联规则
10.4 提高Apriori算法的效率
10.5 FP增长方法
10.6 关联分类方法
10.7 多维关联规则挖掘
10.8 复习题
10.9 参考书目
第11章 Web挖掘和文本挖掘
11.1Web挖掘
11.2 Web内容、结构与使用挖掘
11.3 HITS和LOGSOM算法
11.4 挖掘路径遍历模式
11.5 PageRank算法
11.6 文本挖掘
11.7 潜在语义分析
11.8 复习题
11.9 参考书目
第12章 数据挖掘高级技术
12.1 图挖掘
第13章 遗传算法
第14章 模糊集和模糊逻辑
第15章 可视化方法
附录A 数据挖掘工具
附录B 数据挖掘应用
应用信息
同类热门
类似软件
SPSS Modeler 181.78G5206人在用 SPSS Modeler 18是一款数据挖掘和文本分析软件,可用于构建预测模型和进行高级数据分析。在这次版本中,带来了大量实用功能,内置性能更加强大的大数据算法,支持的平台更加广泛(包括Windows10)。 除此之外,SPSS Mod
查看
数据挖掘技术与工程实践25.09M190人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看热门标签
网友评论1人参与,1条评论
最新排行
轻松学SQL Server数据库39.94M张钦pdf扫描版轻松学SQL Server数据库是一本SQL Server数据库学习手册,由张钦、崔程、李立新等编著。本书详细地讲解了SQL Server 2008中的各种知识点,并使用大量的实践案例来应用这些知识点,使读者能够更加深入、快速地掌握和了解各章节中的知识。
查看
电气工程师手册电子版26.89Mpdf高清版 如何更好的学习电气工程呢?小编这里带来了电气工程师手册pdf下载,高清版,是一款专业的电气工程师电子图书,全面系统地介绍了电气工程各专业基本、常用以及全新的技术内容,既有理论性,又有实践性,适合从事电气工作的技术人员使用,也可供其他有关专业人员和高
查看
android应用案例开发大全第三版pdf123.32M吴亚峰高清扫描版 android应用案例开发大全第三版是一本毕业设计、项目实战、商业开发的案例参考指南手册,由吴亚峰、苏亚光和于复兴三人共同编著。本书技术新颖,贴近实战,涵盖了现实中几乎所有的流行技术,如3D、传感器、OpenGL ES 2.0、动态壁纸、LBS百度
查看
mariadb入门很简单77.98M黄缙华pdf扫描版mariadb入门很简单是一本内容极其全面的MariaDB图书,由数据库专家黄缙华编著。全书浅显易懂,零门槛也能学习MariaDB数据库技术,全书包含402个示例、17个综合实例、1个项目案例、48个常见问题解答、19个上机实践、69个习题,涉及面极广,
查看
Android任务驱动式教程37.84Mpdf高清版 Android任务驱动式教程是一本高清pdf格式的电子书,书本以eclipse为集成开发环境,结合作者近年来在手机软件研发和教学中积累的经验,以一个企业级的手机研发项目--手机文件管理器的开发过程为主线,详细介绍了android平台开发的相关知识。
查看
linux从入门到精通第2版104.07M刘忆智pdf扫描版 linux从入门到精通第2版是一本备受推崇的linux精品畅销书,由刘忆智等人共同编著,全书拥有内容丰富、讲解细腻、通俗易懂和实用性强等特色,以最新的Ubuntu 12.04为写作背景,详细的介绍了linux的基础应用、系统管理、网络应用、娱乐和办
查看
设计模式之禅第2版pdf10.64M扫描版 设计模式之禅第2版是设计模式领域公认的3本经典著作之一,由资深软件开发工程师秦小波编著。本书深刻解读了6大软件设计原则和28种设计模式的准确定义、应用方法和实践,全方位比较各种同类模式之间的异同,详细讲解了组合使用不同模式的方法。 此外
查看
深入浅出数据分析pdf35.06M扫描版 深入浅出数据分析是一本数据分析手册,由Michael Milton编著,李芳翻译。本书构思跌宕起伏,行文妙趣横生,无论读者是职场老手,还是业界新人;无论是字斟句酌,还是信手翻阅,都能跟着文字在职场中走上几回,体味数据分析领域的乐趣与挑战。
查看
写给大家看的c语言书(第2版)41.09M佩里pdf扫描版 写给大家看的c语言书(第2版)是一部别开生面、与众不同的C语言经典入门著作,由美国计算机编程专家佩里编著。本书内容丰富,将C语言的基础知识、必备的实战技能和宝贵编程经验尽数道来。没有云山雾罩,没有前因后果的行话,没有艰深而且不必要的内部技术细节,没
查看
第1楼 河南省新乡市移动 网友