大小:25.09M
更新时间:23-08-29
系统:Pc
数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中包括数据挖掘定制化项目案例,也涵盖了数据挖掘应用系统的开发及详细技术介绍,还有通过数据挖掘通用工具开展的应用案例展示。从技术上,涉及数据挖掘、数理统计、数据库技术,以及更广泛的各种IT技术,欢迎免费下载阅读。
数据挖掘是当前最活跃的领域之一。《数据挖掘技术与工程实践》作者根据自己20年数据挖掘方面的经验,总结了数据挖掘的理论知识和实践经验,提供了大量一线资料。本书首先介绍数据挖掘的概念和误区,然后介绍数据探索的方法,包括数据查探、数据描绘、数据变换、数据优化等,重点介绍了相关算法,包括:相关因子算法、聚类算法、分类算法、回归与测试算法等。不仅列举了详细示例,还介绍了算法在工程实践中的具体应用,特别是总结了自己独特的一些新算法,例如秩相关因子选择算法、矢量相关因子选择算法、密度分布聚类算法、概率特征模型算法等。还剖析了几个热门领域的实际应用,涉及医药学、信息安全、新闻分析、商品推荐、证券预测等领域的应用。最后归纳总结了数据挖掘应用系统的开发方案,并介绍一个数据挖掘工具的应用。
《数据挖掘技术与工程实践》可供数据挖掘、数据仓库、数据库等领域的技术人员参考,也可供想建立智能计算系统的企业信息系统管理人员参考。
第1章 数据挖掘应用绪论1
1.1 认识数据挖掘1
1.1.1 数据挖掘概念2
1.1.2 数据挖掘与生活4
1.1.3 数据挖掘与知识6
1.2 数据挖掘应用基础6
1.2.1 事物与维度7
1.2.2 分布与关系9
1.2.3 描绘与预测11
1.2.4 现象和知识13
1.2.5 规律与因果13
1.3 数据挖掘应用系统工程14
1.3.1 数据层14
1.3.2 算法层18
1.3.3 应用层23
1.4 数据挖掘应用体会26
1.4.1 项目关键点26
1.4.2 技术与应用创新27
1.4.3 经验积累与应用28
1.5 无限三维嵌套空间假说28
1.5.1 一维空间29
1.5.2 二维空间29
1.5.3 三维空间29
1.5.4 突破三维空间30
1.5.5 五维空间31
1.5.6 六维空间31
1.6 本章小结32
第2章 数据探索与准备33
2.1 数据关系探索34
2.1.1 业务发现34
2.1.2 关系发现36
2.1.3 数据质量探索37
2.1.4 数据整合40
2.2 数据特征探索42
2.2.1 数据的统计学特征42
2.2.2 统计学特征应用48
2.3 数据选择52
2.3.1 适当的数据规模52
2.3.2 数据的代表性53
2.3.3 数据的选取54
2.4 数据处理56
2.4.1 数据标准化57
2.4.2 数据离散化58
2.5 统计学算法的数量条件60
2.5.1 样本量估计概念60
2.5.2 单样本总体均值比较的样本量估计(T-Test)61
2.5.3 两样本总体均值比较的样本量估计(T-Test)62
2.5.4 多样本总体均值比较的样本量估计(F-Test)63
2.5.5 区组设计多样本总体均值比较的样本量估计(F-Test)66
2.5.6 直线回归与相关的样本量估计66
2.5.7 对照分析的样本量估计67
2.6 数据探索应用68
2.6.1 检验项的疾病分布69
2.6.2 疾病中检验项的分布70
2.6.3 成对检验项的相关分析71
2.6.4 两种药物的应用分析71
2.7 本章小结73
第3章 数据挖掘应用算法74
3.1 聚类分析74
3.1.1 划分聚类算法(K均值)75
3.1.2 层次聚类算法(组平均)79
3.1.3 密度聚类算法84
3.2 特性选择85
3.2.1 特性选择概念85
3.2.2 线性相关算法90
3.2.3 相关因子SRCF算法91
3.3 特征抽取100
3.3.1 主成分分析算法101
3.3.2 因子分析算法102
3.3.3 非负矩阵因子分解NMF算法103
3.4 关联规则104
3.4.1 关联规则概念105
3.4.2 Apriori算法105
3.4.3 FP树频集算法106
3.4.4 提升Lift107
3.5 分类和预测107
3.5.1 支持向量机107
3.5.2 Logistic回归算法112
3.5.3 朴素贝叶斯分类算法115
3.5.4 决策树121
3.5.5 人工神经网络125
3.5.6 分类与聚类的关系129
3.6 时间序列129
3.6.1 灰色系统预测模型129
3.6.2 ARIMA模型预测135
3.7 本章小结136
第4章 数据挖掘应用案例137
4.1 特性选择的应用137
4.1.1 数据整合137
4.1.2 数据描绘138
4.1.3 数据标准化139
4.1.4 特性选择探索139
4.2 分类模型的应用——算法比较144
4.2.1 数据整合144
4.2.2 数据描绘145
4.2.3 数据标准化148
4.2.4 特性选择探索148
4.2.5 分类模型150
4.3 分类模型的应用——网络异常侦测151
4.3.1 计算机网络异常行为152
4.3.2 网络异常数据模型152
4.3.3 分类模型算法应用156
4.4 算法的综合应用——肿瘤标志物的研究159
4.4.1 样本选取160
4.4.2 癌胚抗原临床特征主题分析164
4.4.3 癌胚抗原临床特征规则分析167
4.4.4 癌胚抗原临床特征规则的比较分析172
4.4.5 癌胚抗原相关因子分析173
4.4.6 不同等级癌胚抗原组差异分析176
4.5 数据挖掘在其他领域中的应用180
4.6 本章小结182
第5章 数据挖掘行业应用原理183
5.1 传统医学科研方法的现状184
5.1.1 传统医学科研的命题与假说184
5.1.2 传统医学科研的数据应用185
5.1.3 传统的医学科研的统计学应用186
5.1.4 传统医学科研的流程186
5.2 智能医学科研系统的需求187
5.2.1 临床医学科研的问题187
5.2.2 临床医学科研的解决思路188
5.3 智能医学科研系统的设计思想190
5.3.1 科研立题190
5.3.2 科研设计与统计分析191
5.3.3 样本数据收集与分析192
5.4 智能医学科研系统的核心技术方法193
5.5 智能医学科研系统的科研数据仓库建设194
5.5.1 医学科研数据仓库建设的技术方法194
5.5.2 医学科研数据仓库的建设过程196
5.5.3 科研数据仓库的数据安全198
5.6 智能医学科研系统的核心功能设计198
5.7 智能医学科研系统的整体功能设计199
5.7.1 智能医学科研系统主要功能200
5.7.2 智能医学科研系统的模块设计和应用实现202
5.7.3 智能医学科研系统的评估方法211
5.8 智能医学科研系统的应用价值215
5.9 本章小结218
第6章 数据挖掘应用系统的开发219
6.1 数据挖掘应用系统的意义219
6.2 IMRS系统设计221
6.2.1 对数据源的分析221
6.2.2 数据挖掘应用系统IMRS的总体设计224
6.3 IMRS异常侦测模型的开发232
6.3.1 异常侦测模型的功能展示232
6.3.2 数据挖掘技术开发要点236
6.4 IMRS特征抽取模型的开发242
6.4.1 特征抽取模型的功能展示242
6.4.2 数据挖掘技术开发要点243
6.5 IMRS智能统计模型的开发255
6.5.1 回归模型的开发实现255
6.5.2 线性相关模型的开发实现267
6.6 IMRS的算法开发271
6.6.1 相关因子算法SRCF的实现271
6.6.2 朴素贝叶斯分类算法的实现275
6.7 本章小结280
第7章 数据挖掘应用系统的应用281
7.1 分布探索282
7.1.1 两维度聚类模型应用282
7.1.2 高维度聚类模型应用287
7.2 关系探索289
7.2.1 关联规则的应用289
7.2.2 特性选择的应用292
7.3 特征探索297
7.3.1 不稳定心绞痛的特征总结297
7.3.2 动脉硬化心脏病的临床特征302
7.4 异常探索305
7.4.1 生理指标的异常侦测305
7.4.2 异常侦测模型的比较307
7.5 推测探索308
7.6 应用系统的高级应用310
7.6.1 异常侦测的高级用法310
7.6.2 关联规则的高级应用315
7.7 本章小结320
第8章 数据挖掘工具的应用321
8.1 应用Oracle Data Mining321
8.1.1 ODM数据挖掘流程322
8.1.2 ODM算法模型323
8.1.3 ODM算法应用327
8.2 应用IBM SPSS Modeler351
8.2.1 IBM SPSS Modeler介绍351
8.2.2 SPSS Modeler独立应用352
8.2.3 SPSS Modeler与应用系统的联合应用359 8.3 本章小结367
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
同类热门
类似软件
写给程序员的数据挖掘实践指南35.98M239人在用写给程序员的数据挖掘实践指南是一本数据挖掘技术指导手册,由软件开发工程师Ron Zacharski编著,知名技术译者王斌老师译作。本书作者采用在实践中学的方式,提供了大量Python的代码和案例,同时还详细的介绍了如何应用数据挖掘技术。通过阅读本书,可以
查看热门标签
网友评论0人参与,0条评论
最新排行
php5与mysql5从入门到精通61.38M卫喆pdf扫描版 php5与mysql5从入门到精通是一本PHP5与MySQL的入门书籍,本书由卫喆和陈争航两人共同编著。全书内容精简而翔实,对使用PHP5与MySQL5进行Web应用开发所必须掌握的基础和核心技术进行了详细介绍,包括服务器环境的构建,PHP基本语法
查看中医基础理论第十版pdf5.22M电子书高清文字版 中医基础理论是对人体生命活动和疾病变化规律的理论概括,也是专门用来研究医学的电子课本,为从事医学行业或医学专业的读者朋友们提供了专业、权威的中医知识内容,并涵盖了多种医学病理,其中包括中医学的哲学基础、藏象、精气血津液神、经络、病因、病机、防治原则
查看illustrator cs4官方教程pdf版13.83M 今天小编为广大网友带来的是illustrator cs4官方教程pdf版,是从Adobe官网下载的ai cs4使用教程,适用于刚接触ai设计的网友免费使用。该教程总共包括16章,详细的介绍了illustrator cs4的新增功能,软件激活和注册方
查看块数据 大数据时代真正到来的标志51.74Mpdf扫描版 块数据是一本首次创新性提出“块数据”这一概念的大数据图书,由大数据战略重点实验室编著。本书从一个新颖的视角——块数据,来看待大数据及其未来的发展,颇有创意!“条数据”和“块数据”的划分,师法自然,抓住了数据的本质。本书源于贵阳市领导在推进大数据应用
查看html5与css3基础教程 第8版33.79M高清扫描版html5与css3基础教程 第8版是一本介绍html5和css3语言的网页基础教材,由美国程序员Elizabeth Castro和Bruce Hyslop编著。本书内容直观透彻、循序渐进,基础知识与案例实践紧密结合,采用独特的双栏图文并排方式,手把手指
查看html5开发精要与实例详解60.84M陆凌牛pdf扫描版html5开发精要与实例详解是一本html5的实战手册,由资深Web开发工程师陆凌牛编著。本书内容丰富,主要以实践为核心,通过28个精心设计的中大型案例对这些理论知识点进行了充分讲解,每个案例都以迭代的方式实现,不仅包含案例需求描述、实现效果展示、开发步
查看seo网络赢利的秘密pdf32.33M高清电子版互联网seo是新兴的职业,如何更好入门呢,这是小编带来了seo网络赢利的秘密pdf下载,这是号称“seo第一人”王通先生的力作,全称为seo网络赢利的秘密 我是怎样通过网络挣到100万的,清华大学出版社出版,详细的介绍了网络seo方法,帮助用户和企业对自
查看数据重现文件系统原理精解与数据恢复最佳实践31.66M马林pdf扫描版数据重现文件系统原理精解与数据恢复最佳实践是一本全面介绍Windows及非Windows文件系统的数据恢复技术书籍,简称为数据重现,由马林编著。全书内容丰富翔实,主要介绍了使用较为广泛的MBR分区体系,还详细介绍了Apple、GPT等分区体系;在文件系统
查看学通ASP.NET的24堂课81.47M房大伟pdf扫描版ASP.NET是微软公司推出的一款新一代动态web应用程序开发平台,具有方便性,灵活,性能优,生产效率高,安全性高等特性,是目前主流的网络编程工具,但如何更好的快速掌握呢?小编这里推荐用户使用学通ASP.NET的24堂课,这是一本ASP.NET技术的学习
查看飞天开放平台编程指南阿里云计算的实践59.63M周憬宇 pdf扫描版 飞天开放平台编程指南:阿里云计算的实践是一本云计算应用接地气作品,由周憬宇、李武军和过敏意三人共同编著。本书是阿里云计算官方作品,不但由浅入深地阐述了云计算的相关原理,而且用很多实例详细讲解了怎样利用飞天平台的编程接口来开发各种互联网应用和服务,让
查看深入浅出android软件开发教程53.59M张雪梅高凯pdf扫描版 深入浅出android软件开发教程是一本学习Android程序设计非常实用的教材,由张雪梅和高凯两人共同编著。本书配有丰富的示例程序,讲解深入浅出,可以帮助初学者在较短的时间内掌握Android软件的开发方法。示例程序短小精悍,既能帮助读者理解知识
查看SEO实战指导知识策略案例42.68M扫描版 seo又叫做搜索引擎优化,由搜索引擎和优化两个部分组成,其中搜索引擎是平台,而优化是动作。如何更好的学习seo呢?这里小编带来了SEO实战指导知识策略案例,这是一本搜索引擎优化(SEO)百科全书,由藏锋者、郝永清编著。本书采用案例引导加实际操作详细
查看