大小:40.51M
更新时间:23-08-30
系统:Pc
机器学习与R语言是一本涵盖机器学习核心算法手册,由美国程序员布雷特·兰茨编著。本书内容丰富翔实,通过丰富的实际案例来探索如何应用r来进行现实世界问题的机器学习,如何从数据中获取可以付诸行动的洞察力。通过阅读本书,你将学到:用r准备用于机器学习的数据,用r进行数据探索和数据可视化,用k近领方法进行数据分类,用线性回归预测数值型数据等等,非常适合对机器学习和R语言感兴趣的用户下载阅读。
推荐序
译者序
前言
关于审稿人
第1章 机器学习简介1
1.1 机器学习的起源1
1.2 机器学习的使用与滥用3
1.2.1 机器学习的成功使用3
1.2.2 机器学习的限制4
1.2.3 机器学习的伦理方面5
1.3 机器如何学习6
1.3.1 数据存储7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 评估10
1.4 实践中的机器学习11
1.4.1 输入数据的类型11
1.4.2 机器学习算法的类型12
1.4.3 为输入数据匹配算法14
1.5 使用R进行机器学习15
1.5.1 安装R添加包15
1.5.2 载入和卸载R添加包16
1.6 总结16
第2章 数据的管理和理解18
2.1 R数据结构18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 数据框23
2.1.5 矩阵和数组25
2.2 用R管理数据27
2.2.1 保存、载入和移除R数据结构27
2.2.2 用CSV文件导入和保存数据28
2.3 探索和理解数据29
2.3.1 探索数据的结构29
2.3.2 探索数值变量30
2.3.3 探索分类变量38
2.3.4 探索变量之间的关系40
2.4 总结43
第3章 懒惰学习—使用近邻分类44
3.1 理解近邻分类44
3.1.1 kNN算法45
3.1.2 为什么kNN算法是懒惰的50
3.2 例子—用kNN算法诊断乳腺癌51
3.2.1 第1步—收集数据51
3.2.2 第2步—探索和准备数据52
3.2.3 第3步—基于数据训练模型55
3.2.4 第4步—评估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 总结59
第4章 概率学习—朴素贝叶斯分类60
4.1 理解朴素贝叶斯60
4.1.1 贝叶斯方法的基本概念61
4.1.2 朴素贝叶斯算法65
4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
4.2.1 第1步—收集数据69
4.2.2 第2步—探索和准备数据70
4.2.3 第3步—基于数据训练模型81
4.2.4 第4步—评估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 总结84
第5章 分而治之—应用决策树和规则进行分类85
5.1 理解决策树85
5.1.1 分而治之86
5.1.2 C5.0决策树算法89
5.2 例子—使用C5.0决策树识别高风险银行贷款91
5.2.1 第1步—收集数据92
5.2.2 第2步—探索和准备数据92
5.2.3 第3步—基于数据训练模型94
5.2.4 第4步—评估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分类规则101
5.3.1 独立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 来自决策树的规则105
5.3.5 什么使决策树和规则贪婪106
5.4 例子—应用规则学习算法识别有毒的蘑菇108
5.4.1 第1步—收集数据108
5.4.2 第2步—探索和准备数据108
5.4.3 第3步—基于数据训练模型109
5.4.4 第4步—评估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 总结114
第6章 预测数值型数据—回归方法115
6.1 理解回归115
6.1.1 简单线性回归117
6.1.2 普通最小二乘估计119
6.1.3 相关性120
6.1.4 多元线性回归121
6.2 例子—应用线性回归预测医疗费用124
6.2.1 第1步—收集数据124
6.2.2 第2步—探索和准备数据125
6.2.3 第3步—基于数据训练模型129
6.2.4 第4步—评估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回归树和模型树134
6.4 例子—用回归树和模型树估计葡萄酒的质量136
6.4.1 第1步—收集数据137
6.4.2 第2步—探索和准备数据137
6.4.3 第3步—基于数据训练模型139
6.4.4 第4步—评估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 总结145
第7章 黑箱方法—神经网络和支持向量机147
7.1理解神经网络147
7.1.1从生物神经元到人工神经元148
7.1.2激活函数149
7.1.3网络拓扑151
7.1.4用后向传播训练神经网络154
7.2例子—用人工神经网络对混凝土的强度进行建模155
7.2.1第1步—收集数据155
7.2.2第2步—探索和准备数据156
7.2.3第3步—基于数据训练模型157
7.2.4第4步—评估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量机161
7.3.1用超平面分类161
7.3.2对非线性空间使用核函数164
7.4例子—用支持向量机进行光学字符识别166
7.4.1第1步—收集数据166
7.4.2第2步—探索和准备数据167
7.4.3第3步—基于数据训练模型168
7.4.4第4步—评估模型的性能170
7.4.5第5步—提高模型的性能171
7.5总结172
第8章 探寻模式—基于关联规则的购物篮分析173
8.1理解关联规则173
8.1.1用于关联规则学习的Apriori算法174
8.1.2度量规则兴趣度—支持度和置信度175
8.1.3用Apriori原则建立规则176
8.2例子—用关联规则确定经常一起购买的食品杂货177
8.2.1第1步—收集数据177
8.2.2第2步—探索和准备数据178
8.2.3第3步—基于数据训练模型183
8.2.4第4步—评估模型的性能185
8.2.5第5步—提高模型的性能187
8.3总结190
第9章 寻找数据的分组—k均值聚类191
9.1理解聚类191
9.1.1聚类—一种机器学习任务192
9.1.2k均值聚类算法193
9.2例子—用k均值聚类探寻青少年市场细分198
9.2.1第1步—收集数据199
9.2.2第2步—探索和准备数据199
9.2.3第3步—基于数据训练模型203
9.2.4第4步—评估模型的性能205
9.2.5第5步—提高模型的性能207
9.3总结208
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
应用信息
同类热门
类似软件
r语言数据分析与挖掘实战41.88M411人在用 r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程
查看
r语言与网站分析 完整版43.3M189人在用 r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学
查看热门标签
网友评论0人参与,0条评论
最新排行
深入浅出mysql第二版 pdf180.33M扫描版 深入浅出mysql数据库开发优化与管理维护(第2版),简称为深入浅出mysql第二版,是一本MySQL数据库使用指导指南,由唐汉明,翟振兴,关宝军三人共同编著。本书内容丰富翔实,从开发、管理和管理维护3个角度逐步深入,全面介绍MySQL数据库技术,
查看
自己动手写操作系统pdf高清版30.91M于渊无水印影印版 自己动手写操作系统是于渊编写的一本编程爱好者编写的别具一格、颇有特色的操作系统原理与实现的图书,本书在详细分析操作系统原理的基础上,用丰富的实例代码,一步一步地指导读者用C语言和汇编语言编写出一个具备操作系统基本功能的操作系统框架。作者对系统初启、
查看
oracle dba手记3数据库性能优化与内部原理解析44.8M盖国强pdf扫描版 oracle dba手记3,全称oracle dba手记3数据库性能优化与内部原理解析,是一本面向程序员的数据库访问性能优化法则,由由盖国强,杨廷琨,冯春培等人编著。全书分为四篇,第一篇为dba之路,由冯春培编写,是他对多年的职业经历与行业观察的总
查看
精通django(django 1.8 lts全解)6.07Mpdf扫描版精通django(django 1.8 lts全解)是一本Django的入门指导书,由澳大利亚一名商务系统开发者Nigel George编著,本书采用由简到繁,循序渐进的方法,深入说明 Django 的机制,教你使用它构建 Web 应用。其次,适当讨论高
查看
31天学会crm项目开发79.97M代前杰pdf扫描版 31天学会crm项目开发是一套CRM项目系统实战手册,由国内企业IT专家代前杰编著。本书内容丰富翔实,是一本很有特色的程序员入门参考用书。全书以企业管理信息系统建设为主题,以客户关系管理系统(CRM)为开发实战项目,使用C#程序语言,从需求分析、方
查看
jquery easyui开发指南47.9M王波pdf扫描版 jquery easyui开发是一款非常流行的前端开发技术,主要是将软件开发中的前端部分,以不同插件的形式展示出来,以供开发人员选择。但如何才能更好的学习掌握jquery easyui呢?这里小编推荐大家阅读《jquery easyui开发指南》,
查看
笨办法学ruby第3版1.38MZed A. Shaw pdf扫描版笨办法学ruby第3版是一本Ruby平台学习书籍,由美国程序员Zed A. Shaw编著。在这本书中,你将通过完成52个精心设计的习题来学习Ruby。阅读这些习题,输入代码(不许复制和粘贴),修正你的错误,观察程序的运行。在这个过程中,你将了解软件是如何
查看
企业级ios应用开发实战40.64M杨宏焱pdf扫描版 企业级ios应用开发实战是一本ios企业应用开发的详细开发教程,由杨宏焱编著,机械工业出版社出版。本书内容十分全面,系统的讲解了开发企业级ios应用所需掌握的各项核心技术,以及各种工具个框架的使用方法,同时还包含了大量的技巧和实践,以及精心设计的辅
查看
精通matlab最优化计算 第2版26.3M龚纯pdf扫描版 精通matlab最优化计算 第2版是一本MATLAB最新优化计算手册,由龚纯和王正林两人共同编著。全书分16章进行展开,分为MATLAB入门篇、优化计算基础篇、优化计算高级篇和综合应用篇。作者通过优化的工具箱和自编函数实现双管齐下,算法原理,流程,
查看