大小:40.51M
更新时间:23-08-30
系统:Pc
版本:v
机器学习与R语言是一本涵盖机器学习核心算法手册,由美国程序员布雷特·兰茨编著。本书内容丰富翔实,通过丰富的实际案例来探索如何应用r来进行现实世界问题的机器学习,如何从数据中获取可以付诸行动的洞察力。通过阅读本书,你将学到:用r准备用于机器学习的数据,用r进行数据探索和数据可视化,用k近领方法进行数据分类,用线性回归预测数值型数据等等,非常适合对机器学习和R语言感兴趣的用户下载阅读。
推荐序
译者序
前言
关于审稿人
第1章 机器学习简介1
1.1 机器学习的起源1
1.2 机器学习的使用与滥用3
1.2.1 机器学习的成功使用3
1.2.2 机器学习的限制4
1.2.3 机器学习的伦理方面5
1.3 机器如何学习6
1.3.1 数据存储7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 评估10
1.4 实践中的机器学习11
1.4.1 输入数据的类型11
1.4.2 机器学习算法的类型12
1.4.3 为输入数据匹配算法14
1.5 使用R进行机器学习15
1.5.1 安装R添加包15
1.5.2 载入和卸载R添加包16
1.6 总结16
第2章 数据的管理和理解18
2.1 R数据结构18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 数据框23
2.1.5 矩阵和数组25
2.2 用R管理数据27
2.2.1 保存、载入和移除R数据结构27
2.2.2 用CSV文件导入和保存数据28
2.3 探索和理解数据29
2.3.1 探索数据的结构29
2.3.2 探索数值变量30
2.3.3 探索分类变量38
2.3.4 探索变量之间的关系40
2.4 总结43
第3章 懒惰学习—使用近邻分类44
3.1 理解近邻分类44
3.1.1 kNN算法45
3.1.2 为什么kNN算法是懒惰的50
3.2 例子—用kNN算法诊断乳腺癌51
3.2.1 第1步—收集数据51
3.2.2 第2步—探索和准备数据52
3.2.3 第3步—基于数据训练模型55
3.2.4 第4步—评估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 总结59
第4章 概率学习—朴素贝叶斯分类60
4.1 理解朴素贝叶斯60
4.1.1 贝叶斯方法的基本概念61
4.1.2 朴素贝叶斯算法65
4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
4.2.1 第1步—收集数据69
4.2.2 第2步—探索和准备数据70
4.2.3 第3步—基于数据训练模型81
4.2.4 第4步—评估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 总结84
第5章 分而治之—应用决策树和规则进行分类85
5.1 理解决策树85
5.1.1 分而治之86
5.1.2 C5.0决策树算法89
5.2 例子—使用C5.0决策树识别高风险银行贷款91
5.2.1 第1步—收集数据92
5.2.2 第2步—探索和准备数据92
5.2.3 第3步—基于数据训练模型94
5.2.4 第4步—评估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分类规则101
5.3.1 独立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 来自决策树的规则105
5.3.5 什么使决策树和规则贪婪106
5.4 例子—应用规则学习算法识别有毒的蘑菇108
5.4.1 第1步—收集数据108
5.4.2 第2步—探索和准备数据108
5.4.3 第3步—基于数据训练模型109
5.4.4 第4步—评估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 总结114
第6章 预测数值型数据—回归方法115
6.1 理解回归115
6.1.1 简单线性回归117
6.1.2 普通最小二乘估计119
6.1.3 相关性120
6.1.4 多元线性回归121
6.2 例子—应用线性回归预测医疗费用124
6.2.1 第1步—收集数据124
6.2.2 第2步—探索和准备数据125
6.2.3 第3步—基于数据训练模型129
6.2.4 第4步—评估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回归树和模型树134
6.4 例子—用回归树和模型树估计葡萄酒的质量136
6.4.1 第1步—收集数据137
6.4.2 第2步—探索和准备数据137
6.4.3 第3步—基于数据训练模型139
6.4.4 第4步—评估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 总结145
第7章 黑箱方法—神经网络和支持向量机147
7.1理解神经网络147
7.1.1从生物神经元到人工神经元148
7.1.2激活函数149
7.1.3网络拓扑151
7.1.4用后向传播训练神经网络154
7.2例子—用人工神经网络对混凝土的强度进行建模155
7.2.1第1步—收集数据155
7.2.2第2步—探索和准备数据156
7.2.3第3步—基于数据训练模型157
7.2.4第4步—评估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量机161
7.3.1用超平面分类161
7.3.2对非线性空间使用核函数164
7.4例子—用支持向量机进行光学字符识别166
7.4.1第1步—收集数据166
7.4.2第2步—探索和准备数据167
7.4.3第3步—基于数据训练模型168
7.4.4第4步—评估模型的性能170
7.4.5第5步—提高模型的性能171
7.5总结172
第8章 探寻模式—基于关联规则的购物篮分析173
8.1理解关联规则173
8.1.1用于关联规则学习的Apriori算法174
8.1.2度量规则兴趣度—支持度和置信度175
8.1.3用Apriori原则建立规则176
8.2例子—用关联规则确定经常一起购买的食品杂货177
8.2.1第1步—收集数据177
8.2.2第2步—探索和准备数据178
8.2.3第3步—基于数据训练模型183
8.2.4第4步—评估模型的性能185
8.2.5第5步—提高模型的性能187
8.3总结190
第9章 寻找数据的分组—k均值聚类191
9.1理解聚类191
9.1.1聚类—一种机器学习任务192
9.1.2k均值聚类算法193
9.2例子—用k均值聚类探寻青少年市场细分198
9.2.1第1步—收集数据199
9.2.2第2步—探索和准备数据199
9.2.3第3步—基于数据训练模型203
9.2.4第4步—评估模型的性能205
9.2.5第5步—提高模型的性能207
9.3总结208
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
同类热门
类似软件
r语言数据分析与挖掘实战41.88M294人在用r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程和数据
查看r语言与网站分析 完整版43.3M153人在用r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学原理,
查看inventor2021简体中文语言包64位50.1M340人在用inventor2021简体中文语言包是针对inventor professional 2021软件而开发的简体中文补丁包,是从autodesk公司官方下载的,能够将英文的软件更换成简体中文,从而帮助中国用户更好的使用软件,再配合软件包中的破解补丁一起使
查看热门标签
网友评论0人参与,0条评论
最新排行
07s906给水排水构筑物设计选用图34.83Mpdf高清电子版07s906给水排水构筑物设计选用图简称为07s906图集,能够适用于民用建筑与一般工业建筑及城镇的给水排水工程,由中国建筑标准设计研究院编写,中华人民共和国建设部批准发布,针对水池、水塔、化粪池、小型排水建筑物有效,在已编制出版的给水排水构筑物国家标准
查看全唐诗检索工具官方版8.94Mv1.0 全唐诗检索工具官方版是由网友采用Python开发的一款唐诗查询工具,绿色小巧,安全无毒。该软件导入了《全唐诗》书籍中的全部诗词内容,非常丰富,同时支持用户输入诗人名、诗名、部分诗句等内容来进行快速查找唐诗,这样就能为研究者猛提供了莫大的方便。不过需
查看Node.js微服务13.56M大卫冈萨雷斯pdf扫描版 Node.js微服务是一本Node.js教学书籍,由美国程序员大卫冈萨雷斯David Gonzalez编著。本书内容丰富翔实,主要内容要点为:理解Node.js模块并掌握在与微服务打交道时的最佳实践、将现有的单块系统重新架构成面向微服务的软件、使用
查看android开发范例实战宝典79.16Mpdf扫描版android开发范例实战宝典是一本安卓开发学习实战教材,由武永亮编著。本书重点讲解了200多个常见的Android开发实例,并对重点代码做了大量注释和讲解,通过对这些实例的演练,可以快速提高读者的开发水平。全书内容全面,涵盖广泛,介绍了Android开
查看421页pdf百度云资源5.32M想要了解明星的更多八卦猛料吗?想知道自己喜欢的明星过去发生过什么事吗?想知道的话,就来下载本站的421页pdf文件,该文件已经上传到百度云资源,它详细记录了大量明星的私下猛料,作者是一位追星多年并且搜集明星新闻和小道消息的一名女孩,经过多年的追星一点一滴
查看hbase企业应用开发实战107.27Mpdf扫描版hbase企业应用开发实战是一本HBase大数据相关的学习书籍,由国内资深Hadoop技术专家马延辉、猛鑫、李立松等人联合编著,本书以企业实际生产环境和需要为重点,系统的介绍了HBase的功能使用、框架设计、基本原理和高级特性。详细讲解使用HBase设计
查看html5秘籍第2版107.18Mpdf扫描版HTML5不仅仅是一种标记语言,它还指代多种独立的Web标准。但是如何才能学习html5的全部知识呢?小编推荐用户使用html5秘籍第2版,这是一本HTML5语言的学习指导书籍,由美国程序员Matthew MacDonald编著。本书内容丰富,由浅入深,
查看31天学会crm项目开发79.97M代前杰pdf扫描版31天学会crm项目开发是一套CRM项目系统实战手册,由国内企业IT专家代前杰编著。本书内容丰富翔实,是一本很有特色的程序员入门参考用书。全书以企业管理信息系统建设为主题,以客户关系管理系统(CRM)为开发实战项目,使用C#程序语言,从需求分析、方案设计
查看HTML+CSS网页开发技术精解61.4M吴玉中pdf扫描版HTML+CSS网页开发技术精解是一本html和css语言的开发书籍,由吴玉中等人共同编著。本书内容丰富翔实,涵盖了HTML和CSS大部分常用元素和属性。并且作者使用典型实例,用图解方式诠释每个语法的具体使用方法。还全面讲解CSS控制页面表现的方法,包括
查看matlab高效编程技巧与应用25个案例分析45.35M吴鹏pdf扫描版matlab高效编程技巧与应用25个案例分析是作者吴鹏八年MATLAB使用经验的总结而成一本书籍,本书力图以一种全新的模式,从各个角度将MATLAB呈现给读者。全书共分两部分:第一部分(第1~5章)是有关MATLAB高效编程的一些方法、原则介绍;第二部分
查看构建oracle高可用环境58.61M陈吉平pdf扫描版构建oracle高可用环境是一本介绍管理OracLe高可用数据库的经验之书,由陈吉平著作,电子工业出版社出版。全书内容横跨主机、存储、数据库三大领域,全面介绍oracle及周边环境的高可用性,所有的内容都包括了作者多年来Oracle高可用数据库的经验,在
查看游戏编程权威指南第4版pdf98.95M游戏编程权威指南 第4版是一本经典的游戏编程入门读物,由美国程序员麦克沙福瑞和格雷海姆两人共同编著。本书探讨了整个游戏开发过程和与创建游戏相关的挑战。在对游戏框架的介绍中,作者探讨了现代游戏引擎的主要子系统以及可用于实际游戏中的专业技术。全书内容包括可以
查看