大小:40.51M
更新时间:23-08-30
系统:Pc
机器学习与R语言是一本涵盖机器学习核心算法手册,由美国程序员布雷特·兰茨编著。本书内容丰富翔实,通过丰富的实际案例来探索如何应用r来进行现实世界问题的机器学习,如何从数据中获取可以付诸行动的洞察力。通过阅读本书,你将学到:用r准备用于机器学习的数据,用r进行数据探索和数据可视化,用k近领方法进行数据分类,用线性回归预测数值型数据等等,非常适合对机器学习和R语言感兴趣的用户下载阅读。
推荐序
译者序
前言
关于审稿人
第1章 机器学习简介1
1.1 机器学习的起源1
1.2 机器学习的使用与滥用3
1.2.1 机器学习的成功使用3
1.2.2 机器学习的限制4
1.2.3 机器学习的伦理方面5
1.3 机器如何学习6
1.3.1 数据存储7
1.3.2 抽象化7
1.3.3 一般化9
1.3.4 评估10
1.4 实践中的机器学习11
1.4.1 输入数据的类型11
1.4.2 机器学习算法的类型12
1.4.3 为输入数据匹配算法14
1.5 使用R进行机器学习15
1.5.1 安装R添加包15
1.5.2 载入和卸载R添加包16
1.6 总结16
第2章 数据的管理和理解18
2.1 R数据结构18
2.1.1 向量18
2.1.2 因子20
2.1.3 列表21
2.1.4 数据框23
2.1.5 矩阵和数组25
2.2 用R管理数据27
2.2.1 保存、载入和移除R数据结构27
2.2.2 用CSV文件导入和保存数据28
2.3 探索和理解数据29
2.3.1 探索数据的结构29
2.3.2 探索数值变量30
2.3.3 探索分类变量38
2.3.4 探索变量之间的关系40
2.4 总结43
第3章 懒惰学习—使用近邻分类44
3.1 理解近邻分类44
3.1.1 kNN算法45
3.1.2 为什么kNN算法是懒惰的50
3.2 例子—用kNN算法诊断乳腺癌51
3.2.1 第1步—收集数据51
3.2.2 第2步—探索和准备数据52
3.2.3 第3步—基于数据训练模型55
3.2.4 第4步—评估模型的性能56
3.2.5 第5步—提高模型的性能57
3.3 总结59
第4章 概率学习—朴素贝叶斯分类60
4.1 理解朴素贝叶斯60
4.1.1 贝叶斯方法的基本概念61
4.1.2 朴素贝叶斯算法65
4.2 例子—基于贝叶斯算法的手机垃圾短信过滤69
4.2.1 第1步—收集数据69
4.2.2 第2步—探索和准备数据70
4.2.3 第3步—基于数据训练模型81
4.2.4 第4步—评估模型的性能82
4.2.5 第5步—提高模型的性能83
4.3 总结84
第5章 分而治之—应用决策树和规则进行分类85
5.1 理解决策树85
5.1.1 分而治之86
5.1.2 C5.0决策树算法89
5.2 例子—使用C5.0决策树识别高风险银行贷款91
5.2.1 第1步—收集数据92
5.2.2 第2步—探索和准备数据92
5.2.3 第3步—基于数据训练模型94
5.2.4 第4步—评估模型的性能97
5.2.5 第5步—提高模型的性能97
5.3 理解分类规则101
5.3.1 独立而治之101
5.3.2 1R算法103
5.3.3 RIPPER算法104
5.3.4 来自决策树的规则105
5.3.5 什么使决策树和规则贪婪106
5.4 例子—应用规则学习算法识别有毒的蘑菇108
5.4.1 第1步—收集数据108
5.4.2 第2步—探索和准备数据108
5.4.3 第3步—基于数据训练模型109
5.4.4 第4步—评估模型的性能111
5.4.5 第5步—提高模型的性能112
5.5 总结114
第6章 预测数值型数据—回归方法115
6.1 理解回归115
6.1.1 简单线性回归117
6.1.2 普通最小二乘估计119
6.1.3 相关性120
6.1.4 多元线性回归121
6.2 例子—应用线性回归预测医疗费用124
6.2.1 第1步—收集数据124
6.2.2 第2步—探索和准备数据125
6.2.3 第3步—基于数据训练模型129
6.2.4 第4步—评估模型的性能131
6.2.5 第5步—提高模型的性能132
6.3 理解回归树和模型树134
6.4 例子—用回归树和模型树估计葡萄酒的质量136
6.4.1 第1步—收集数据137
6.4.2 第2步—探索和准备数据137
6.4.3 第3步—基于数据训练模型139
6.4.4 第4步—评估模型的性能142
6.4.5 第5步—提高模型的性能143
6.5 总结145
第7章 黑箱方法—神经网络和支持向量机147
7.1理解神经网络147
7.1.1从生物神经元到人工神经元148
7.1.2激活函数149
7.1.3网络拓扑151
7.1.4用后向传播训练神经网络154
7.2例子—用人工神经网络对混凝土的强度进行建模155
7.2.1第1步—收集数据155
7.2.2第2步—探索和准备数据156
7.2.3第3步—基于数据训练模型157
7.2.4第4步—评估模型的性能159
7.2.5第5步—提高模型的性能159
7.3理解支持向量机161
7.3.1用超平面分类161
7.3.2对非线性空间使用核函数164
7.4例子—用支持向量机进行光学字符识别166
7.4.1第1步—收集数据166
7.4.2第2步—探索和准备数据167
7.4.3第3步—基于数据训练模型168
7.4.4第4步—评估模型的性能170
7.4.5第5步—提高模型的性能171
7.5总结172
第8章 探寻模式—基于关联规则的购物篮分析173
8.1理解关联规则173
8.1.1用于关联规则学习的Apriori算法174
8.1.2度量规则兴趣度—支持度和置信度175
8.1.3用Apriori原则建立规则176
8.2例子—用关联规则确定经常一起购买的食品杂货177
8.2.1第1步—收集数据177
8.2.2第2步—探索和准备数据178
8.2.3第3步—基于数据训练模型183
8.2.4第4步—评估模型的性能185
8.2.5第5步—提高模型的性能187
8.3总结190
第9章 寻找数据的分组—k均值聚类191
9.1理解聚类191
9.1.1聚类—一种机器学习任务192
9.1.2k均值聚类算法193
9.2例子—用k均值聚类探寻青少年市场细分198
9.2.1第1步—收集数据199
9.2.2第2步—探索和准备数据199
9.2.3第3步—基于数据训练模型203
9.2.4第4步—评估模型的性能205
9.2.5第5步—提高模型的性能207
9.3总结208
1、下载并解压,得出pdf文件
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
同类热门
类似软件
inventor2021简体中文语言包64位50.1M365人在用inventor2021简体中文语言包是针对inventor professional 2021软件而开发的简体中文补丁包,是从autodesk公司官方下载的,能够将英文的软件更换成简体中文,从而帮助中国用户更好的使用软件,再配合软件包中的破解补丁一起使
查看r语言数据分析与挖掘实战41.88M324人在用r语言数据分析与挖掘实战是一本由10余位数据挖掘领域资深专家和科研人员0余年大数据挖掘咨询与实施经验结晶,由张良均,云伟标,王路,刘晓勇四人编著。全书以数据挖掘的应用出发,以电力、航空、医疗等10个行业真实案例为主线,详细讲解了R数据挖掘建模的过程和数据
查看r语言与网站分析 完整版43.3M166人在用r语言与网站分析是一本R语言与网站分析技术实战手册,由李明编著。本书侧重于R语言对网站分析和挖掘的代码实现,并不侧重于对计算结果的分析讨论以及网站统计的思维方法。同时,本书以通俗的非学术语言结合实际的代码案例来介绍网站分析的基本思路和统计理论的数学原理,
查看热门标签
网友评论0人参与,0条评论
最新排行
07s906给水排水构筑物设计选用图34.83Mpdf高清电子版07s906给水排水构筑物设计选用图简称为07s906图集,能够适用于民用建筑与一般工业建筑及城镇的给水排水工程,由中国建筑标准设计研究院编写,中华人民共和国建设部批准发布,针对水池、水塔、化粪池、小型排水建筑物有效,在已编制出版的给水排水构筑物国家标准
查看精通Java Web整合开发(第二版)225.47M刘斌 pdf扫描版 精通Java Web整合开发(第二版)是一本Java Web技术整合开发书籍,由刘斌编著。本书为轻量级Java EE应用开发人员提供一整套实用的主流开发技术,融入了作者多年的Java EE应用开发经验。任何知识点均配以实例进行讲解,每个实例提供同步
查看linux大棚命令百篇(下)33.78M吴鹏冲pdf扫描版linux大棚命令百篇(下)是一本Linux命令大全指南,由吴鹏冲,杨文强和张昱三人共同编著。本书作者运用十分幽默风趣的语言,从Shell命令开始,介绍了文件编辑与内容处理,文件的查找、压缩与硬盘管理,网络相关命令,进程与性能调优,Linux 系统管理等
查看深入浅出iPhone开发pdf版137.03M 《深入浅出iPhone开发》是针对iPhone开发的初学者设计的首选的入门书,它会告诉你如何使用iOS SDK工具,包括Xcode 4框架的知识,以及Objectjive-C编程语言的使用技巧。 《深入浅出iPhone开发》汇集了大量的
查看《口译实例与技巧》电子版17.78MPDF高清扫描版 口译实例与技巧是冯建中教授主编的国内第一部口译实战案例与译员经验合集,是《实用英语口译教程》和《英汉口译实练》两部教材的指定配套读物。我们为什么要学习英语?是为了更好的了解国外的先进技术,因为我们国家现在还处在发展阶段,很多东西都不如外国的先进,所
查看R和Ruby数据分析之旅22.83M郑兆雄pdf扫描版R和Ruby数据分析之旅是一本特别的、充满趣味和奇思妙想的编程书,由新加坡程序员郑兆雄Sau Sheong Chang编著。全书内容丰富翔实,将带你从头开始学习Ruby和R语言的基本知识和特性。开篇分别对ruby和r语言做了从零开始、简明扼要的介绍,包括
查看编写高质量代码改善c#程序的157个建议6.67M陆敏技pdf扫描版编写高质量代码改善c#程序的157个建议是一本关于如何编写高质量C#代码的工具书,由陆敏技编著。本书从语法、程序架构和设计,编码习惯和编程规范3个层面深入探讨,编写高质理c#代码的技巧、禁忌和最佳实践,为C#程序员如何编写更高质量的C#代码提供了157条
查看乔布斯的魔力演讲pdf37M关于乔布斯,回想起来想必每一位用户看到他的名字都会联想到现在的苹果设备,而它也因苹果成为了万人瞩目的名人!而他也在1985年获得了由里根总统授予的国家级技术勋章、1997年成为《时代周刊》的封面人物,同年被评为最成功的管理者,是声名显赫的“计算机狂人”。
查看数据挖掘技术与工程实践25.09M洪松林pdf扫描版 数据挖掘技术与工程实践是深入学习数据挖掘技术并进行工程实践的必读之作,由资深数据挖掘技术专家庄映辉和李堃编著。本书内容的跨度较大,涵盖的内容比较广泛,既有对数据挖掘概念的探讨,也有对数据挖掘技术和原理的介绍,还有对数据挖掘应用实践的体会和总结。其中
查看neo4j实战pdf完整版11.82M高清扫描版neo4j实战是一本介绍Neo4j图形数据库的实战手册,由英国数据库管理员阿列克萨·武科蒂奇编著。本书以实例为依托,详细地对实例做建模分析,并给出经过测试的源代码,主要介绍了Neo4j数据库概述、Neo4j的数据模型 、Neo4j开发入门、Neo4j的查
查看数据恢复技术(第二版)74.62M戴剑士pdf扫描版数据恢复技术第2版是一本强大的数据恢复技术教材,由戴剑士编著。本书内容丰富翔实,全面详解Windows文件系统原理,介绍了硬盘分区,硬盘逻辑锁,硬盘坏道,FAT恢复,文件恢复,磁盘阵列(RAID)的数据恢复等技术,同时还对数据安全与备份,损坏文件修复,病
查看