大小:1.95M
更新时间:23-08-24
系统:Pc
大数据挑战与nosql数据库技术是一本NoSQL数据库数据操作手册,由陆嘉恒编著。本书内容丰富翔实,主要从理论、系统、应用三个方面详细讲述了大数据的技术知识,并针对NoSQL数据库技术做了深入的分享,是学习大数据技术的地图、指南手册,可以帮助读者跳出迷局,厘清思路,系统地做好相关知识储备,拥抱大数据时代!
《大数据挑战与nosql数据库技术》共分为三部分。理论篇重点介绍大数据时代下数据处理的基本理论及相关处理技术,并引入NoSQL数据库;系统篇主要介绍了各种类型NoSQL数据库的基本知识;应用篇对国内外几家知名公司在利用NoSQL数据库处理海量数据方面的实践做了阐述。本书对大数据时代面临的挑战,以及NoSQL数据库的基本知识做了清晰的阐述,有助于读者整理思路,了解需求,并更有针对性、有选择地深入学习相关知识。
第1章 概论
1.1 引子
1.2 大数据挑战
1.3 大数据的存储和管理
1.3.1 并行数据库
1.3.2 NoSQL数据管理系统
1.3.3 NewSQL数据管理系统
1.3.4 云数据管理
1.4 大数据的处理和分析
1.5 小结
参考文献
理 论 篇
第2章 数据一致性理论
2.1 CAP理论
2.2 数据一致性模型
2.3 ACID与BASE
2.4 数据一致性实现技术
2.4.1 Quorum系统NRW策略
2.4.2 两阶段提交协议
2.4.3 时间戳策略
2.4.4 Paxos
2.4.5 向量时钟
2.5 小结
参考文献
第3章 数据存储模型
3.1 总论
3.2 键值存储
3.2.1 Redis
3.2.2 Dynamo
3.3 列式存储
3.3.1 Bigtable
3.3.2 Cassandra与HBase
3.4 文档存储
3.4.1 MongoDB
3.4.2 CouchDB
3.5 图形存储
3.5.1 Neo4j
3.5.2 GraphDB
3.6 本章小结
参考文献
第4章 数据分区与放置策略
4.1 分区的意义
4.1.1 为什么要分区
4.1.2 分区的优点
4.2 范围分区
4.3 列表分区
4.4 哈希分区
4.5 三种分区的比较
4.6 放置策略
4.6.1 一致性哈希算法
4.6.2 容错性与可扩展性分析
4.6.3 虚拟节点
4.7 小结
参考文献
第5章 海量数据处理方法
5.1 MapReduce简介
5.2 MapReduce数据流
5.3 MapReduce数据处理
5.3.1 提交作业
5.3.2 初始化作业
5.3.3 分配任务
5.3.4 执行任务
5.3.5 更新任务执行进度和状态
5.3.6 完成作业
5.4 Dryad简介
5.4.1 DFS Cosmos介绍
5.4.2 Dryad执行引擎
5.4.3 DryadLINQ解释引擎
5.4.4 DryadLINQ编程
5.5 Dryad数据处理步骤
5.6 MapReduce vs Dryad
5.7 小结
参考文献
第6章 数据复制与容错技术
6.1 海量数据复制的作用和代价
6.2 海量数据复制的策略
6.2.1 Dynamo的数据库复制策略
6.2.2 CouchDB的复制策略
6.2.3 PNUTS的复制策略
6.3 海量数据的故障发现与处理
6.3.1 Dynamo的数据库的故障发现与处理
6.3.2 CouchDB的故障发现与处理
6.3.3 PNUTS的故障发现与处理
6.4 小结
参考文献
第7章 数据压缩技术
7.1 数据压缩原理
7.1.1 数据压缩的定义
7.1.2 数据为什么可以压缩
7.1.3 数据压缩分类
7.2 传统压缩技术[1]
7.2.1 霍夫曼编码
7.2.2 LZ77算法
7.3 海量数据带来的3V挑战
7.4 Oracle混合列压缩
7.4.1 仓库压缩
7.4.2 存档压缩
7.5 Google数据压缩技术
7.5.1 寻找长的重复串
7.5.2 压缩算法
7.6 Hadoop压缩技术
7.6.1 LZO简介
7.6.2 LZO原理[5]
7.7 小结
参考文献
第8章 缓存技术
8.1 分布式缓存简介
8.1.1 分布式缓存的产生
8.1.2 分布式缓存的应用
8.1.3 分布式缓存的性能
8.1.4 衡量可用性的标准
8.2 分布式缓存的内部机制
8.2.1 生命期机制
8.2.2 一致性机制
8.2.3 直读与直写机制
8.2.4 查询机制
8.2.5 事件触发机制
8.3 分布式缓存的拓扑结构
8.3.1 复制式拓扑
8.3.2 分割式拓扑
8.3.3 客户端缓存拓扑
8.4 小结
参考文献
系 统 篇
第9章 key-value数据库
9.1 key-value模型综述
9.2 Redis
9.2.1 Redis概述
9.2.2 Redis下载与安装
9.2.3 Redis入门操作
9.2.4 Redis在业内的应用
9.3 Voldemort
9.3.1 Voldemort概述
9.3.2 Voldemort下载与安装
9.3.3 Voldemort配置
9.3.4 Voldemort开发介绍[3]
9.4 小结
参考文献
第10章 Column-Oriented数据库
10.1 Column-Oriented数据库简介
10.2 Bigtable数据库
10.2.1 Bigtable数据库简介
10.2.2 Bigtable数据模型
10.2.3 Bigtable基础架构
10.3 Hypertable数据库
10.3.1 Hypertable简介
10.3.2 Hypertable安装
10.3.3 Hypertable架构
10.3.4 基本概念和原理
10.3.5 Hypertable的查询
10.4 Cassandra数据库
10.4.1 Cassandra简介
10.4.2 Cassandra配置
10.4.3 Cassandra数据库的连接
10.4.4 Cassandra集群机制
10.4.5 Cassandra的读/写机制
10.5 小结
参考文献
第11章 文档数据库
11.1 文档数据库简介
11.2 CouchDB数据库
11.2.1 CouchDB简介
11.2.2 CouchDB安装
11.2.3 CouchDB入门
11.2.4 CouchDB查询
11.2.5 CouchDB的存储结构
11.2.6 SQL和CouchDB
11.2.7 分布式环境中的CouchDB
11.3 MongoDB数据库
11.3.1 MongoDB简介
11.3.2 MongoDB的安装
11.3.3 MongoDB入门
11.3.4 MongoDB索引
11.3.5 SQL与MongoDB
11.3.6 MapReduce与MongoDB
11.3.7 MongoDB与CouchDB对比
11.4 小结
参考文献
第12章 图存数据库
12.1 图存数据库的由来及基本概念
12.1.1 图存数据库的由来
12.1.2 图存数据库的基本概念
12.2 Neo4j图存数据库
12.2.1 Neo4j简介
12.2.2 Neo4j使用教程
12.2.3 分布式Neo4j--Neo4j HA
12.2.4 Neo4j工作机制及优缺点浅析
12.3 GraphDB
12.3.1 GraphDB简介
12.3.2 GraphDB的整体架构
12.3.3 GraphDB的数据模型
12.3.4 GraphDB的安装
12.3.5 GraphDB的使用
12.4 OrientDB
12.4.1 背景
12.4.2 OrientDB是什么
12.4.3 OrientDB的原理及相关技术
12.4.4 Windows下OrientDB的安装与使用
12.4.5 相关Web应用
12.5 三种图存数据库的比较
12.5.1 特征矩阵
12.5.2 分布式模式及应用比较
12.6 小结
参考文献
第13章 基于Hadoop的数据管理系统
13.1 Hadoop简介
13.2 HBase
13.2.1 HBase体系结构
13.2.2 HBase数据模型
13.2.3 HBase的安装和使用
13.2.4 HBase与RDBMS
13.3 Pig
13.3.1 Pigr的安装和使用
13.3.2 Pig Latin语言
13.3.3 Pig实例
13.4 Hive
13.4.1 Hive的数据存储
13.4.2 Hive的元数据存储
13.4.3 安装Hive
13.4.4 HiveQL简介
13.4.5 Hive的网络接口(WebUI)
13.4.6 Hive的JDBC接口
13.5 小结
参考文献
第14章 NewSQL数据库
14.1 NewSQL数据库简介
14.2 MySQL Cluster
14.2.1 概述
14.2.2 MySQL Cluster的层次结构
14.2.3 MySQL Cluster的优势和应用
14.2.4 海量数据处理中的sharding技术
14.2.5 单机环境下MySQL Cluster的安装
14.2.6 MySQL Cluster的分布式安装与配置指导
14.3 VoltDB
14.3.1 传统关系数据库与VoltDB
14.3.2 VoltDB的安装与配置
14.3.3 VoltDB组件
14.3.4 Hello World
14.3.5 使用Generate脚本
14.3.6 Eclipse集成开发
14.4 小结
参考文献
第15章 分布式缓存系统
15.1 Memcached缓存技术
15.1.1 背景介绍
15.1.2 Memcached缓存技术的特点
15.1.3 Memcached安装[3]
15.1.4 Memcached中的数据操作
15.1.5 Memcached的使用
15.2 Microsoft Velocity分布式缓存系统
15.2.1 Microsoft Velocity简介
15.2.2 数据分类
15.2.3 Velocity核心概念
15.2.4 Velocity安装
15.2.5 一个简单的Velocity客户端应用
15.2.6 扩展型和可用性
15.3 小结
参考文献
精品推荐
同类热门
类似软件
nosql数据库技术实战65.98M325人在用 nosql数据库技术实战是一本NoSQL数据库技术实战书籍手册,本书是腾讯公司前资深后台工程师皮雄军呕心沥血之作,全书介绍NoSQL从基本操作到高级技术和核心原理,再到项目开发的所有重点知识,书中详细讲解了NoSQL的兴起原因、CAP理论、副本之间
查看热门标签
网友评论0人参与,0条评论
最新排行
离散数学及其应用(原书第6版)76.74M 离散数学及其应用(原书第6版)是一本经典的离散数学教材,由(美)罗森(Rosen,K.H)著;袁崇义,屈婉玲,张桂芸等译,机械工业出版社发行。全书全面而系统地介绍了离散数学的理论和方法,内容涉及数学推理、组合分析、离散结构、算法思维以及应用与建模。
查看07s906给水排水构筑物设计选用图34.83Mpdf高清电子版07s906给水排水构筑物设计选用图简称为07s906图集,能够适用于民用建筑与一般工业建筑及城镇的给水排水工程,由中国建筑标准设计研究院编写,中华人民共和国建设部批准发布,针对水池、水塔、化粪池、小型排水建筑物有效,在已编制出版的给水排水构筑物国家标准
查看领域驱动设计与模式实战63.82M尼尔森(Jimmy Nilsson)高清扫描版 领域驱动设计与模式实战是一本将企业应用架构模式和领域驱动设计两大名著精髓的实战演练书籍,由瑞典程序员尼尔森(Jimmy Nilsson)编著。全书内容丰富翔实,将Martin Fowler企业应用架构模式和Eric Evans领域驱动设计两部经典名
查看node.js 硬实战115个核心技巧11.1M高清pdf扫描版 node.js 硬实战115个核心技巧是一本能够让你真正学会用好Node高级技术的进阶读物,由美国程序员Alex R.Young和Marc.Harter共同编著。本书作者精心组织了115 个已通过测试的例子,并细致剖析保障这些Node应用良好运行的
查看Scala程序设计第二版15.83Mpdf高清完整版想要学习Scala程序设计看哪方面的书籍好呢?小编推荐您看看这本Scala程序设计第二版pdf格式的电子书,这本书里主要讲解了Scala的函数式风格、自适应类型、闭包、XML处理、模式匹配和并发编程等内容。本书既适合Scala初学者入门,也适合经验丰富的
查看jquery easyui开发指南47.9M王波pdf扫描版 jquery easyui开发是一款非常流行的前端开发技术,主要是将软件开发中的前端部分,以不同插件的形式展示出来,以供开发人员选择。但如何才能更好的学习掌握jquery easyui呢?这里小编推荐大家阅读《jquery easyui开发指南》,
查看html5与css3基础教程 第8版33.79M高清扫描版html5与css3基础教程 第8版是一本介绍html5和css3语言的网页基础教材,由美国程序员Elizabeth Castro和Bruce Hyslop编著。本书内容直观透彻、循序渐进,基础知识与案例实践紧密结合,采用独特的双栏图文并排方式,手把手指
查看笨办法学ruby第3版1.38MZed A. Shaw pdf扫描版笨办法学ruby第3版是一本Ruby平台学习书籍,由美国程序员Zed A. Shaw编著。在这本书中,你将通过完成52个精心设计的习题来学习Ruby。阅读这些习题,输入代码(不许复制和粘贴),修正你的错误,观察程序的运行。在这个过程中,你将了解软件是如何
查看2017建设工程经济教材14.38Mpdf高清版 小编这次为广大网友带来的是2017建设工程经济教材pdf下载,也就是2017一建建设工程经济教材电子版本,全书是根据人力资源和社会保障部、住房和城乡建设部审定通过的《全国一级建造师执业资格考试大纲)) (2014 年版)编写和修订。包括了工程经济、
查看移动App性能评测与优化pdf14.01M 移动App性能评测与优化是一本APP性能评测优化指导教材,由腾讯公司的TMQ专项测试团队编著。全书除了较为体系化地介绍了移动应用性能评测与优化的方方面面,在一些单点上也有很多原创性的突破,如电量的硬件测试方案、GT评测插件等。移动App性能评测与优
查看仙剑奇侠传6操作指南pdf18.39M 仙剑奇侠传6位于“大宇资讯旗下软星科技有限公司”制作的最新一款单机角色扮演游戏,在2015年7月8日正式发布,相信不少游戏玩家都纷纷加入到游戏当中,而今日小编为游戏玩家带来的是仙剑奇侠传6操作指南pdf,在该说明书中包含了各种游戏介绍和操作指南,适
查看高性能javascript37.21M尼古拉斯·泽卡斯pdf扫描版 高性能JavaScript是JavaScript语言领域的一本经典教材,由雅虎首页开发者尼古拉斯·泽卡斯编著。全书从性能角度分析JavaScript,不求面面俱到,但求字字如金。重点讨论了JavaScript的各个方面,内容涵盖运行时间、下载、do
查看MySQL5权威指南(第3版)55.3M科夫勒pdf扫描版 MySQL5权威指南(第3版)是一本非常权威的MySQL5数据库使用指南,由程序员科夫勒和杨晓云两人共同编著。本书内容丰富翔实,详细的介绍了MySQL 5.0,讨论了新的程序设计接口(如PHP 5里的mysqli)和新的系统管理工具,同时还讨论了如
查看