大小:47.54M
更新时间:23-09-07
系统:Pc
全书结构针对学习曲线进行了优化,由浅至深,从理论基础到项目实战,适合Hadoop的初学者阅读,也适合作为高等院校相关课程的教学参考书。
基础篇:Hadoop基础 第1章 绪论 1.1 Hadoop和云计算 1.1.1 Hadoop的电梯演讲 1.1.2 Hadoop生态圈 1.1.3 云计算的定义 1.1.4 云计算的类型 1.1.5 Hadoop和云计算 1.2 Hadoop和大数据 1.2.1 大数据的定义 1.2.2 大数据的结构类型 1.2.3 大数据行业应用实例 1.2.4 Hadoop和大数据 1.2.5 其他大数据处理平台 1.3 数据挖掘和商业智能 1.3.1 数据挖掘的定义 1.3.2 数据仓库 1.3.3 操作数据库系统和数据仓库系统的区别 1.3.4 为什么需要分离的数据仓库 1.3.5 商业智能 1.3.6 大数据时代的商业智能 第2章 环境准备 2.1 Hadoop的发行版本选择 2.1.1 Apache Hadoop 2.1.2 CDH 2.1.3 Hadoop的版本 2.1.4 如何选择Hadoop的版本 2.2 Hadoop架构 2.2.1 Hadoop HDFS架构 2.2.2 Hadoop MapReduce架构 2.2.3 Hadoop架构 2.3 安装Hadoop 2.3.1 安装运行环境 2.3.2 修改主机名和用户名 2.3.3 配置静态IP地址 2.3.4 配置SSH无密码连接 2.3.5 安装JDK 2.3.6 配置Hadoop 2.3.7 格式化HDFS 2.3.8 启动Hadoop并验证安装 2.4 安装Hive 2.4.1 安装元数据库 2.4.2 修改Hive配置文件 2.4.3 验证安装 2.5 安装Sqoop 2.6 Eclipse Hadoop插件的安装和使用 2.6.1 安装并配置Eclipse Hadoop插件 2.6.2 Eclipse插件的使用 第3章 Hadoop的基石:HDFS 3.1 认识HDFS 3.1.1 HDFS的设计理念 3.1.2 HDFS的架构 3.1.3 HDFS容错 3.2 HDFS读取文件和写入文件 3.2.1 块的分布 3.2.2 数据读取 3.2.3 写入数据 3.2.4 数据完整性 3.3 如何访问HDFS 3.3.1 命令行接口 3.3.2 Java API 3.3.3 其他常用的接口 3.3.4 Web UI 第4章 分而治之的智慧:MapReduce 4.1 认识MapReduce 4.1.1 MapReduce的编程思想 4.1.2 MapReduce运行环境 4.1.3 MapReduce作业和任务 4.1.4 MapReduce的计算资源划分 4.1.5 MapReduce的局限性 4.2 Hello WordCount 4.2.1 WordCount的设计思路 4.2.2 编写WordCount 4.2.3 运行程序 4.2.4 还能更快吗 4.3 MapReduce的过程 4.3.1 从输入到输出 4.3.2 input 4.3.3 map及中间结果的输出 4.3.4 shuffle 4.3.5 reduce及最后结果的输出 4.3.6 sort 4.3.7 作业的进度组成 4.4 MapReduce的工作机制 4.4.1 作业提交 4.4.2 作业初始化 4.4.3 任务分配 4.4.4 任务执行 4.4.5 任务完成 4.4.6 推测执行 4.4.7 MapReduce容错 4.5 MapReduce编程 4.5.1 Writable类 4.5.2 编写Writable类 4.5.3 编写Mapper类 4.5.4 编写Reducer类 4.5.5 控制shuffle 4.5.6 控制sort 4.5.7 编写main函数 4.6 MapReduce编程实例:连接 4.6.1 设计思路 4.6.2 编写Mapper类 4.6.3 编写Reducer类 4.6.4 编写main函数 4.7 MapReduce编程实例:二次排序 4.7.1 设计思路 4.7.2 编写Mapper类 4.7.3 编写Partitioner类 4.7.4 编写SortComparator类 4.7.5 编写Reducer类 4.7.6 编写main函数 4.8 MapReduce编程实例:全排序 4.8.1 设计思路 4.8.2 编写代码 第5章 SQL on Hadoop:Hive 5.1 认识Hive 5.1.1 从MapReduce到SQL 5.1.2 Hive架构 5.1.3 Hive与关系型数据库的区别 5.1.4 Hive命令的使用 5.2 数据类型和存储格式 5.2.1 基本数据类型 5.2.2 复杂数据类型 5.2.3 存储格式 5.2.4 数据格式 5.3 HQL:数据定义 5.3.1 Hive中的数据库 5.3.2 Hive中的表 5.3.3 创建表 5.3.4 管理表 5.3.5 外部表 5.3.6 分区表 5.3.7 删除表 5.3.8 修改表 5.4 HQL:数据操作 5.4.1 装载数据 5.4.2 通过查询语句向表中插入数据 5.4.3 利用动态分区向表中插入数据 5.4.4 通过CTAS加载数据 5.4.5 导出数据 5.5 HQL:数据查询 5.5.1 SELECT…FROM语句 5.5.2 WHERE语句 5.5.3 GROUP BY和HAVING语句 5.5.4JOIN语句 5.5.5 ORDER BY和SORT BY语句 5.5.6 DISTRIBUTE BY和SORTBY语句 5.5.7 CLUSTER BY 5.5.8 分桶和抽样 5.5.9 UNION ALL 5.6 Hive函数 5.6.1 标准函数 5.6.2 聚合函数 5.6.3 表生成函数 5.7 Hive用户自定义函数 5.7.1 UDF 5.7.2 UDAF 5.7.3 UDTF 5.7.4 运行 第6章 SQL to Hadoop : Sqoop 6.1 一个Sqoop示例 6.2 导入过程 6.3 导出过程 6.4 Sqoop的使用 6.4.1 codegen 6.4.2 create-hive-table 6.4.3 eval 6.4.4 export 6.4.5 help 6.4.6 import 6.4.7 import-all-tables 6.4.8 job 6.4.9 list-databases 6.4.10 list-tables 6.4.11 merge 6.4.12 metastore 6.4.13 version 第7章 Hadoop性能调优和运维 7.1 Hadoop客户端 7.2 Hadoop性能调优 7.2.1 选择合适的硬件 7.2.2 操作系统调优 7.2.3 JVM调优 7.2.4 Hadoop参数调优7.3 Hive性能调优 7.3.1 JOIN优化 7.3.2 Reducer的数量 7.3.3 列裁剪 7.3.4 分区裁剪 7.3.5 GROUP BY优化 7.3.6 合并小文件 7.3.7 MULTI-GROUP BY和MULTI-INSERT
2、如果打不开本文件,请务必下载pdf阅读器
3、安装后,在打开解压得出的pdf文件
4、双击进行阅读
精品推荐
同类热门
类似软件
hadoop实战第2版179.03M280人在用hadoop实战第2版是一本系统且极具实践指导意义的Hadoop工具书和参考书,作者陆嘉恒,已经扫描为pdf高清版电子图书,附带的福昕pdf阅读器可以完美打开浏览阅读。由于第1版广受好评,第2版基于hadoop及其相关技术最新版本撰写,从多角度做了全面的
查看hadoop大数据分析与挖掘实战38.23M281人在用hadoop大数据分析与挖掘实战是一本Hadoop大数据分析实战书籍,由张良均,樊哲,赵云龙和李成华四人共同编著。本书以大家熟知的Hadoop技术来展开,理论部分介绍了Hadoop生态系统基本原理及常用大数据挖掘建模工具。案例部分以解决某个应用的挖掘目标
查看深入理解hadoop 原书第2版50.83M325人在用深入理解hadoop 原书第2版是一本Hadoop系统使用掌握指导书籍,由世界级大数据专家萨米尔.瓦德卡和马杜.西德林埃共同编著。全书深入剖析了Hadoop系统实现原理及其工程实践应用,里面包含了大量真实案例和数据,从Hadoops各组件的运行机理,深入
查看hadoop核心技术pdf44.83M194人在用Hadoop核心技术是由百度Hadoop技术专家翟周伟撰写的一本Hadoop技术学习书籍,全书结合了百度大数据实践,直击企业痛点,主要对Hadoop的基本原理和优化配置由浅入深进行了详细分析,最后通过实战案例进一步讲解分析。本书对HDFS、MapRedu
查看热门标签
网友评论0人参与,0条评论
最新排行
轻而易举黑客攻防入门41.81M先知文化pdf扫描版 轻而易举黑客攻防入门是一本黑客攻防类型的学习教材,由先知文化编著,电子工业出版社出版。全书从黑客新手的需要和学习习惯出发,详细介绍了黑客基础知识、信息搜集与漏洞扫描、黑客常用命令与工具、windows系统漏洞防范、密码攻防、远程控制攻防、木马攻防、
查看oracle开发实战经典110.75M李兴华pdf扫描版 oracle开发实战经典是一本Oracle数据库实战手册,由李兴华编著。本书以Oracle 12c版本为基础(也适合Oracle 11g版本),对12c的新功能做了详细讲述。并且实例非常丰富,各类实例达1200个,达到实战水平只需一本书够了。同时本
查看Android开发精要17.08MAndroid开发精要是由资深Android专家范怀宇编著的一本Android开发手册,本书详细介绍了高度抽象Android系统的设计理念和底层实现机制,全面概括Android实现原理的“要点”和实际开发中的“精华”,为开发高质量Android应用提供指
查看c#网络编程技术教程57.23M金华pdf扫描版c#网络编程技术教程是一本C#网络编程技术教程手册,由金华和华进两人共同编著。本书注重理论与实践的结合、循序渐进的教学方法,系统介绍了C#网络编程的相关知识,使读者能够快速掌握基于C#的网络应用开发技术。根据应用的需要,书中在内容安排上对C#基础知识进行
查看C#项目开发实战密码146.78M扶松柏pdf扫描版 C#项目开发实战密码是一本C#语言的实战指导学习书籍,由扶松柏编著。本书内容十分丰富,每一章都采用了一个实例,并用这些实例的具体实现流程来教学。在具体讲解每个实例时,都遵循项目的进度来展开,从接到项目到具体开发,直到最后的调试和发布。内容循序渐进,
查看c++入门经典 第9版261.87Mpdf扫描版 c++入门经典 第9版是一本C++语言入门指导书,由美国程序员Walter Savitch编著。本书内容丰富,风格清晰,每一章都是C++的重要知识点,越往后将越加深奥与困难,不过不用太担心,请认真阅读书中章开头的小节总览和随处可见的小结框,它们可以
查看Linux C编程实战64.42M童永清pdf扫描版 linux c编程实战是一本介绍linux系统下如何使用c语言编程开发的图书,由童永清编著。本书结构合理、概念清晰,采用"基础知识→难点解析→重点提示→编程实践"的写作手法,使读者理解更深入、应用更容易、掌握更快速。文中第一篇主要介绍了linux和
查看黑客攻防从入门到精通(黑客与反黑工具篇)12.41M李书梅pdf扫描版 黑客攻防从入门到精通(黑客与反黑工具篇)是一本黑客攻防基础的入门书籍,由李书梅等编著,全书内容紧紧围绕“攻”、“防”两个不同的主题,在讲解黑客攻击手段的同时,介绍了相应的防范方法,图文并茂地再现了网络入侵与防御的全过程,从而让读者了解基础的网络知识
查看mariadb入门很简单77.98M黄缙华pdf扫描版mariadb入门很简单是一本内容极其全面的MariaDB图书,由数据库专家黄缙华编著。全书浅显易懂,零门槛也能学习MariaDB数据库技术,全书包含402个示例、17个综合实例、1个项目案例、48个常见问题解答、19个上机实践、69个习题,涉及面极广,
查看ipad2使用说明书17.7Mpdf中文版ipad2使用说明书是一本全中文版的pdf电子书教程,旨在帮助用户快速从新手过渡到高手,玩转ipad2。教程详细讲述了ipad2使用技巧和基本操作,详细介绍了iPad 2的虚拟键盘的使用,包括文字输入、切换键盘布局、使用快捷键等。它还会介绍iPad 2支
查看