大小:41.88M
更新时间:23-08-16
系统:Pc
版本:v
r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程和数据挖掘的二次开发。全书以大家熟知的数据挖掘建模工具R语言来展开,以解决某个应用的挖掘目标为前提,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中同时穿插操作训练,把相关的知识点嵌入相应的操作过程中,使读者轻松理解并掌握相关的理论和知识点。
《R语言数据分析与挖掘实战》是一本系统性的、以实践为导向的R数据挖掘与分析实战指南,多位技术专家结合自己10多年的经验,以电力、航空、医疗、互联网、制造业等10个行业的实战案例为主线,深入浅出地讲解了如何利用R语言及其相关技术进行数据挖掘建模、数据分析和二次开发,不仅为多个行业提供了成熟的解决方案,而且还提供了大量的技巧。
本书共16章,分三个部分:
基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具R语言进行了简明扼要的说明;第3、4、5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。
实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程等关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用中的理解。
高级篇(第16章),介绍了基于R语言二次开发的数据挖掘应用软件——TipDM数据挖掘建模工具,并以此工具为例详细介绍了基于R语言完成数据挖掘二次开发的各个步骤,使读者体验到通过R语言实现数据挖掘二次开发的强大魅力。
前 言 基 础 篇 第1章 数据挖掘基础2 1.1 某知名连锁餐饮企业的困惑2 1.2 从餐饮服务到数据挖掘3 1.3 数据挖掘的基本任务4 1.4 数据挖掘建模过程4 1.4.1 定义挖掘目标4 1.4.2 数据取样5 1.4.3 数据探索6 1.4.4 数据预处理7 1.4.5 挖掘建模7 1.4.6 模型评价7 1.5 常用数据挖掘建模工具7 1.6 小结9 第2章 R语言简介10 2.1 R安装10 2.2 R使用入门11 2.2.1 R操作界面11 2.2.2 RStudio窗口介绍12 2.2.3 R常用操作13 2.3 R数据分析包16 2.4 配套附件使用设置18 2.5 小结18 第3章 数据探索19 3.1 数据质量分析19 3.1.1 缺失值分析20 3.1.2 异常值分析20 3.1.3 一致性分析22 3.2 数据特征分析23 3.2.1 分布分析23 3.2.2 对比分析25 3.2.3 统计量分析27 3.2.4 周期性分析29 3.2.5 贡献度分析30 3.2.6 相关性分析31 3.3 R语言主要数据探索函数35 3.3.1 统计特征函数35 3.3.2 统计作图函数37 3.4 小结40 第4章 数据预处理41 4.1 数据清洗42 4.1.1 缺失值处理42 4.1.2 异常值处理45 4.2 数据集成45 4.2.1 实体识别46 4.2.2 冗余属性识别46 4.3 数据变换46 4.3.1 简单函数变换46 4.3.2 规范化47 4.3.3 连续属性离散化48 4.3.4 属性构造51 4.3.5 小波变换52 4.4 数据规约55 4.4.1 属性规约55 4.4.2 数值规约58 4.5 R语言主要数据预处理函数61 4.6 小结65 第5章 挖掘建模66 5.1 分类与预测66 5.1.1 实现过程66 5.1.2 常用的分类与预测算法67 5.1.3 回归分析68 5.1.4 决策树73 5.1.5 人工神经网络79 5.1.6 分类与预测算法评价83 5.1.7 R语言主要分类与预测算法函数87 5.2 聚类分析89 5.2.1 常用聚类分析算法89 5.2.2 KMeans聚类算法90 5.2.3 聚类分析算法评价95 5.2.4 R语言主要聚类分析算法函数95 5.3 关联规则97 5.3.1 常用关联规则算法97 5.3.2 Apriori算法98 5.4 时序模式102 5.4.1 时间序列算法103 5.4.2 时间序列的预处理104 5.4.3 平稳时间序列分析105 5.4.4 非平稳时间序列分析107 5.4.5 R语言主要时序模式算法函数114 5.5 离群点检测116 5.5.1 离群点检测方法117 5.5.2 基于模型的离群点检测方法118 5.5.3 基于聚类的离群点检测方法120 5.6 小结122 实 战 篇 第6章 电力窃漏电用户自动识别126 6.1 背景与挖掘目标126 6.2 分析方法与过程129 6.2.1 数据抽取130 6.2.2 数据探索分析130 6.2.3 数据预处理133 6.2.4 构建专家样本137 6.2.5 模型构建138 6.3 上机实验143 6.4 拓展思考144 6.5 小结144 第7章 航空公司客户价值分析145 7.1 背景与挖掘目标145 7.2 分析方法与过程146 7.2.1 数据抽取149 7.2.2 数据探索分析149 7.2.3 数据预处理150 7.2.4 模型构建153 7.3 上机实验158 7.4 拓展思考159 7.5 小结159 第8章 中医证型关联规则挖掘160 8.1 背景与挖掘目标160 8.2 分析方法与过程162 8.2.1 数据获取163 8.2.2 数据预处理165 8.2.3 模型构建169 8.3 上机实验171 8.4 拓展思考172 8.5 小结172 第9章 基于水色图像的水质评价173 9.1 背景与挖掘目标173 9.2 分析方法与过程174 9.2.1 数据预处理175 9.2.2 模型构建177 9.2.3 水质评价179 9.3 上机实验180 9.4 拓展思考180 9.5 小结181 第10章 家用电器用户行为分析与事件识别182 10.1 背景与挖掘目标182 10.2 分析方法与过程183 10.2.1 数据抽取184 10.2.2 数据探索分析185 10.2.3 数据预处理185 10.2.4 模型构建195 10.2.5 模型检验198 10.3 上机实验200 10.4 拓展思考201 10.5 小结202 第11章 应用系统负载分析与磁盘容量预测203 11.1 背景与挖掘目标203 11.2 分析方法与过程205 11.2.1 数据抽取206 11.2.2 数据探索分析206 11.2.3 数据预处理207 11.2.4 模型构建208 11.3 上机实验213 11.4 拓展思考214 11.5 小结215 第12章 电子商务智能推荐服务216 12.1 背景与挖掘目标216 12.2 分析方法与过程222 12.2.1 数据抽取224 12.2.2 数据探索分析225 12.2.3 数据预处理230 12.2.4 模型构建235 12.3 上机实验245 12.4 拓展思考246 12.5 小结251 第13章 基于数据挖掘技术的市财政收入分析预测模型252 13.1 背景与挖掘目标252 13.2 分析方法与过程254 13.2.1 灰色预测与神经网络的组合模型255 13.2.2 数据探索分析256 13.2.3 模型构建259 13.3 上机实验273 13.4 拓展思考273 13.5 小结274 第14章 基于基站定位数据的商圈分析275 14.1 背景与挖掘目标275 14.2 分析方法与过程277 14.2.1 数据抽取277 14.2.2 数据探索分析278 14.2.3 数据预处理279 14.2.4 模型构建282 14.3 上机实验286 14.4 拓展思考286 14.5 小结287 第15章 电商产品评论数据情感分析288 15.1 背景与挖掘目标288 15.2 分析方法与过程288 15.2.1 评论数据采集289 15.2.2 评论预处理292 15.2.3 文本评论分词297 15.2.4 模型构建298 15.3 上机实验312 15.4 拓展思考313 15.5 小结314 提 高 篇 第16章 基于R语言的数据挖掘二次开发316 16.1 混合编程应用体验——TipDM数据挖掘平台316 16.2 二次开发过程环境配置320 16.3 R语言数据挖掘二次开发实例322 16.4 小结325 参考资料326
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
同类热门
类似软件
热门标签
网友评论1人参与,1条评论
最新排行
read2u(中文语音朗读软件)8.99Mv2.1官方版 read2u官方版是一款非常好用的中文语音朗读软件,也就是把电子读物变成有声读物的一种工具,不同于有些校对软件,read2u是专门为了朗读汉字而设计的,具有良好的音质,卓越的多音字识别系统,具有同音乐的完美结合,对于朗读的各项参数具有开放性,它支持
查看16j914-1公用建筑卫生间图集8.26Mpdf电子版16j914-1图集是中国人民共和国住房和城乡建设部批准发布的一款公共卫生间图集,替代02j915,全称为16j914-1公用建筑卫生间图集,对原图集02J915《公用建筑卫生间》进行修编,除新增了交通、文体、商业等类型建筑的卫生间外,还增加了母婴室、第
查看11g101-1图集电子版4.91M官方pdf高清版11g101-1图集,又简称为混凝土结构施工图11g101-1,官方全称为混凝土结构施工图平面整体表示方法制图规则和构造详图(现浇混凝土框架、剪力墙、梁、板),由中华人民共和国住房和城乡建设部批准,中国建筑标准设计研究院编制,可以替代03g101-1、0
查看c++程序设计语言(第4部分:标准库)68.02M原书第4版c++程序设计语言(第4部分:标准库)是C++之父Bjarne Stroustrup编写的全新作品,也是通常用户所说的c++程序设计语言第四版,是无可替代的C++领域经典的参考书,详细的介绍C++11的各项新特性、功能等。全书知识结构完整,对C++语言介
查看android板级支持与硬件相关子系统141.16Mandroid板级支持与硬件相关子系统是一本板级支持与硬件相关子系统书籍,由韩超编著。本书特别选定了Nexus One、Nexus S、Galaxy Nexus等几款手机作为参考平台。其中一个很大的优点就是以上几个平台都是Google认定的,具有典型性,
查看Photoshop卡通漫画设计完全实例教程59.58Mpdf全彩版Photoshop卡通漫画设计完全实例教程是一款pdf全彩版的电子书籍,详细的向读者介绍了完整的卡通设计流程与创作技法。全书共有56个匠心独具的流行风格卡漫实战案例,全面解析了8大类前沿卡漫设计领域,是目前网络上最好用的PS卡通设计教程,适合有一定绘画基
查看2017铁路工程管理与实务73.3Mpdf高清版2017铁路工程管理与实务,又称之为2017一级建造师铁路工程管理与实务电子书,是一级建造师必考的科目,该版本根据2014年版一级建造师《专业工程管理与实务)) (铁路工程)科目考试大纲编写,主要阐述了《考试大纲》的核心内容,按照章节目条排序,不考虑前后
查看photoshop从入门到精通数码照片处理篇34.57Mphotoshop应该是现代办公人员必须学会的软件,不管你工作用得到还是用不到,都应该学会,工作中用得到固然好,用不到的话你也可以给自己的相片美美地PS下啊,难道你没有看过网络上那些PS大神的作品,精彩绝美!今天小编给网友带来了photoshop从入门到
查看java web整合开发王者归来308.04M刘京华pdf扫描版java web整合开发王者归来是一本备受推崇的Java Web开发经典图书,由刘京华等人编著。本书内容丰富翔实,详细的讲解了包括Sring、Struts、Hibemate、Webword、web service、EJB3、JPA、SSH组合在内的许多主
查看origin8.0教程24Mpdf中文版本款origin8.0教程是pdf中文版的电子图书,作者方东明,全书详细的介绍了二维图形绘制实例,并将二维制图的上、中、下三部分合并在一起,同时制作了pdf书签功能,能够为初学origin软件的朋友一个全面整体的了解。软件简介:origin8.0是ori
查看php深度分析:101个核心技巧窍门和问题解决方法原书第2版48.46M沙菲克 pdf扫描版php深度分析:101个核心技巧窍门和问题解决方法原书第2版是想要研究复杂PHP解决方案的PHP开发人员的必备伙伴,本书由德国PHP开发程序员BEN BALBO编著,周广辉、杨建军等翻译。全书首次汇集了定期发布在SitePoint论坛上的常见PHP问题的
查看sql基础教程 第二版11.08MMICK pdf扫描版sql基础教程 第二版是一本SQL的新手入门书籍,由日本资深数据库专家MICK编著,孙淼,罗勇共同翻译。第2版基于新版本RDBMS全面升级,并新增一章介绍从应用程序执行SQL语句的方法。全书从数据库、表的结构到查询、更新表的语法,常用的函数,表的联结等,
查看
第1楼 山西省长治市移动 网友