大小:44.42M
更新时间:23-08-28
系统:Pc
数据挖掘:R语言实战pdf是一本R语言的实战手册,由黄文和王正林两人共同编著。本书侧重使用R进行数据挖掘,重点讲述了R的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R软件进行深入潜出和全面的介绍,以便读者能深刻理解R的精髓并能快速、高效和灵活地掌握使用R进行数据挖掘的技巧。通过阅读数据挖掘r语言实战,读者不仅能掌握使用R及相关的算法包来快速解决实际问题的方法,而且能得到从实际问题分析入手,到利用R进行求解,以及对挖掘结果进行分析的全面训练。
R是一个免费的开源软件,它提供了首屈一指的统计计算和绘图功能,尤其是大量的数据挖掘方面的算法包,使得它成为一款优秀的、不可多得的数据挖掘工具软件。本书的主要目的是向读者介绍如何用R进行数据挖掘,通过大量的精选实例,循序渐进、全面系统地讲述R在数据挖掘领域的应用。
数据挖掘r语言实战以数据预处理、基本算法及应用和高级算法及应用这三篇展开。
(1)上篇:数据预处理’
由第1—5章组成,首先简要介绍数据挖掘流程、算法和工具,然后介绍R中的数据分类和数据集,以及使用R获取数据的多种灵活的方法。最后讲述对数据进行探索性分析和预处理的方法。这些内容是使用R进行数据挖掘的最基础内容。
(2)中篇:基本算法及应用
由第6—9章组成,主要讲述数据挖掘的基本算法及应用,包括关联分析、聚类分析、判别分析和决策树,这些算法也是数据挖掘使用最多最普遍的算法。R中提供了丰富的、功能强大的算法包和实现函数,数据挖掘的初级和中级用户务必掌握。
(3)下篇:高级算法及应用
由第10—14章组成,主要讲述数据挖掘的高级算法及应用,包括集成学习、随机森林、支持向量机和神经网络,以及使用R中的工具对数据挖掘的模型进行评估与选择。对于中高级的用户,可以深入学习一下本篇的内容。
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读试读
第0章 致敬,R!
致敬,肩膀!
致敬,时代!
致敬,人才!
致敬,R 瑟!
上篇 数据预处理
第1章 数据挖掘导引
1.1 数据挖掘概述
1.1.1 数据挖掘的过程
1.1.2 数据挖掘的对象
1.1.3 数据挖掘的方法
1.1.4 数据挖掘的应用
1.2 数据挖掘的算法
1.3 数据挖掘的工具
1.3.1 工具的分类
1.3.2 工具的选择
1.3.3 商用的工具
1.3.4 开源的工具
1.4 R 在数据挖掘中的优势
数据挖掘:R 语言实战
VI
第2章 数据概览
2.1 n×m 数据集
2.2 数据的分类
2.2.1 一般的数据分类
2.2.2 R 的数据分类
2.2.3 用R 简单处理数据
2.3 数据抽样及R 实现
2.3.1 简单随机抽样
2.3.2 分层抽样
2.3.3 整群抽样
2.4 训练集与测试集
2.5 本章汇总
第3章 用R 获取数据
3.1 获取内置数据集
3.1.1 datasets 数据集
3.1.2 包的数据集
3.2 获取其他格式的数据
3.2.1 CSV 与TXT 格式
3.2.2 从Excel 直接获取数据
3.2.3 从其他统计软件中获取数据
3.3 获取数据库数据
3.4 获取网页数据
3.5 本章汇总
第4章 探索性数据分析
4.1 数据集
4.2 数字化探索
4.2.1 变量概况
4.2.2 变量详情
4.2.3 分布指标
4.2.4 稀疏性
4.2.5 缺失值
4.2.6 相关性
4.3 可视化探索
4.3.1 直方图
目 录
VII
4.3.2 累积分布图
4.3.3 箱形图
4.3.4 条形图
4.3.5 点阵图
4.3.6 饼图
4.5 本章汇总
第5章 数据预处理
5.1 数据集加载
5.2 数据清理
5.2.1 缺失值处理
5.2.2 噪声数据处理
5.2.3 数据不一致的处理
5.3 数据集成
5.4 数据变换
5.5 数据归约
5.6 本章汇总
中篇 基本算法及应用
第6章 关联分析
6.1 概述
6.2 R 中的实现
6.2.1 相关软件包
6.2.2 核心函数
6.2.3 数据集
6.3 应用案例
6.3.1 数据初探
6.3.2 对生成规则进行强度控制
6.3.3 一个实际应用
6.3.4 改变输出结果形式
6.3.5 关联规则的可视化
6.4 本章汇总
第7章 聚类分析
7.1 概述
7.1.1 K-均值聚类
数据挖掘:R 语言实战
VIII
7.1.2 K-中心点聚类
7.1.3 系谱聚类
7.1.4 密度聚类
7.1.5 期望最大化聚类
7.2 R 中的实现
7.2.1 相关软件包
7.2.2 核心函数
7.2.3 数据集
7.3 应用案例
7.3.1 K-均值聚类
7.3.2 K-中心点聚类
7.3.3 系谱聚类
7.3.4密度聚类
7.3.5 期望最大化聚类
7.4 本章汇总
第8章 判别分析
8.1 概述
8.1.1 费希尔判别
8.1.2贝叶斯判别
8.1.3 距离判别
8.2 R 中的实现
8.2.1 相关软件包
8.2.2 核心函数
8.2.3 数据集
8.3 应用案例
8.3.1 线性判别分析
8.3.2 朴素贝叶斯分类
8.3.3 K 最近邻
8.3.4 有权重的K 最近邻算法
8.4 推荐系统综合实例
8.4.1 kNN 与推荐
8.4.2 MovieLens 数据集说明
8.4.3 综合运用
8.5 本章汇总
目 录
IX
第9章 决策树
9.1 概述
9.1.1 树形结构
9.1.2 树的构建
9.1.3 常用算法
9.2 R 中的实现
9.2.1 相关软件包
9.2.2 核心函数
9.2.3 数据集
9.3 应用案例
9.3.1 CART 应用
9.3.2 C4.5 应用
9.4 本章汇总
下篇 高级算法及应用
第10章 集成学习
10.1 概述
10.1.1 一个概率论小计算
10.1.2 Bagging 算法
10.1.3 AdaBoost 算法
10.2 R 中的实现
10.2.1 相关软件包
10.2.2 核心函数
10.2.3 数据集
10.3 应用案例
10.3.1 Bagging 算法
10.3.2 Adaboost 算法
10.4 本章汇总
第11章 随机森林
11.1 概述
11.1.1 基本原理
11.1.2 重要参数
11.2 R 中的实现
11.2.1 相关软件包
数据挖掘:R 语言实战
X
11.2.2 核心函数
11.2.3 可视化分析
11.3 应用案例
11.3.1 数据处理
11.3.2 建立模型
11.3.3 结果分析
11.3.4 自变量的重要程度
11.3.5 优化建模
11.4 本章汇总
第12章 支持向量机
12.1 概述
12.1.1 结构风险最小原理
12.1.2 函数间隔与几何间隔
12.1.3 核函数
12.2 R 中的实现
12.2.1 相关软件包
12.2.2 核心函数
12.2.3 数据集
12.3 应用案例
12.3.1 数据初探
12.3.2 建立模型
12.3.3 结果分析
12.3.4 预测判别
12.3.5 综合建模
12.3.6 可视化分析
12.3.7 优化建模
12.4 本章汇总
第13章 神经网络
13.1 概述
13.2 R 中的实现
13.2.1 相关软件包
13.2.2 核心函数
13.3 应用案例
13.3.1 数据初探
目 录
XI
13.3.2 数据处理
13.3.3 建立模型
13.3.4 结果分析
13.3.5 预测判别
13.3.6 模型差异分析
13.3.7 优化建模
13.4 本章汇总第14章 模型评估与选择
14.1 评估过程概述
14.2 安装Rattle 包
14.3 Rattle 功能简介
14.3.1 Data――选取数据
14.3.2 Explore――数据探究
14.3.3 Test――数据相关检验
14.3.4 Transform――数据预处理
14.3.5 Cluster――数据聚类
14.3.6 Model――模型评估
14.3.7 Evaluate――模型评估
14.3.8 Log――模型评估记录
14.4 模型评估相关概念
14.4.1 误判率
14.4.2 正确/错误的肯定判断、正确/错误的否定判断
14.4.3 精确度、敏感度及特异性
14.5 Rattle 在模型评估中的应用
14.5.1 混淆矩阵
14.5.2 风险图
14.5.3 ROC 图及相关图表
14.5.4 模型得分数据集
14.6 综合实例
14.6.1 数据介绍
14.6.2 模型建立
14.6.3 模型结果分析
数据挖掘:R 语言实战
应用信息
同类热门
类似软件
r语言与网站分析 完整版43.3M182人在用 r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学
查看
数据挖掘技术与工程实践25.09M190人在用 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看
r语言数据分析与挖掘实战41.88M397人在用 r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程
查看
SPSS Modeler 181.78G5251人在用 SPSS Modeler 18是一款数据挖掘和文本分析软件,可用于构建预测模型和进行高级数据分析。在这次版本中,带来了大量实用功能,内置性能更加强大的大数据算法,支持的平台更加广泛(包括Windows10)。 除此之外,SPSS Mod
查看热门标签
网友评论0人参与,0条评论
最新排行
read2u(中文语音朗读软件)8.99Mv2.1官方版 read2u官方版是一款非常好用的中文语音朗读软件,也就是把电子读物变成有声读物的一种工具,不同于有些校对软件,read2u是专门为了朗读汉字而设计的,具有良好的音质,卓越的多音字识别系统,具有同音乐的完美结合,对于朗读的各项参数具有开放性,它支持
查看
成功之路Oracle 11g学习笔记115.25M赵振平pdf扫描版 成功之路Oracle 11g学习笔记是一本Oracle 11g技术学习指南,由赵振平编著。本书内容丰富翔实,主要为刚刚开始学习接触Oracle的新手们准备,在前面的章节主要为读者介绍了Oracle安装、干净卸载Oracle、数据库启动关闭、Orac
查看
深入理解linux驱动程序设计22.19M吴国伟pdf扫描版深入理解linux驱动程序设计是一本linux系统驱动设计指导书籍,由吴国伟,姚琳,毕成龙编著。全书以基于Linux内核3.8.13源代码而编写,全面深入地论述了Linux设备驱动开发的全方位技术,揭秘Linux内核、驱动开发、驱动开发实例,主要内容包括
查看
adobe illustrator cc经典教程155.1Mpdf高清扫描版adobe illustrator cc经典教程是Adobe Illustrator CC矢量图绘制软件的使用教程,由软件官方Adobe公司内部人员编著。本书内容丰富,语言通俗易懂并且书中配有大量的图示和实践项目,让读者通过实践来学习如何设计徽标、插图、
查看
尼康d800使用说明书21.81Mpdf电子版尼康d800说明书是尼康官方针对尼康d800单反相机而开发的使用说明书,同时适用于d800和d800e,详细的介绍了相机的使用方法,包括如何快速开始指南,即时取景拍摄,动画即时取景,对焦,释放模式,iso感光度,曝光,白平衡,图像增强,闪光拍摄等等重要知
查看
openstack设计与实现41.66M英特尔开源技术中心pdf扫描版 openstack设计与实现是一本OpenStack必选必读经典,由英特尔开源技术中心编著。本书内容丰富翔实,以juno版本为基础,覆盖了openstack的学习到设计与实现等各个方面的内容,致力于帮助读者形成openstack及其各个主要组件与项
查看
精通matlab最优化计算 第2版26.3M龚纯pdf扫描版 精通matlab最优化计算 第2版是一本MATLAB最新优化计算手册,由龚纯和王正林两人共同编著。全书分16章进行展开,分为MATLAB入门篇、优化计算基础篇、优化计算高级篇和综合应用篇。作者通过优化的工具箱和自编函数实现双管齐下,算法原理,流程,
查看
actionscript 3.0 教程6.06Mpdf中文版 actionscript 3.0 教程是flash动画的脚本语言,如果你想要做好falsh交互动画或游戏,此as3.0教程你一定不能错过。另外小编一并附带了pdf福昕阅读器,方便用户即下即用。本款actionscript 3.0教程详细介绍了脚本的
查看
锋利的jquery第2版106.29Mpdf电子书锋利的jquery第2版是目前学习和进阶jquery最好的电子图书,已经由小编制作成了pdf电子书,用户下载后即可阅读。第2版不仅在内容方面进行更新,而且还在上一版的基础上做了大量的修订和扩展,涵盖了如下几个方面:1、例子全部改用最新的jquery库;2
查看