大小:26.48M
更新时间:23-08-28
系统:Pc
大数据管理:数据集成的技术、方法与最佳实践是一本数据集成领域著作,由美国资深数据集成专家April Reeve编著,余水清,潘黎萍共同翻译。本书高屋建瓴地阐述了在大型组织的环境中,不同计算机系统之间传输数据,以及将异构数据进行集成所用到的技巧、技术以及最佳实践。每一部分都将对该部分所涉及的数据集成类型的架构、工具集以及技术进行阐述,如:批处理集成、实时集成以及大数据集成。同时,在每一部分中还给出了与相关专家就数据集成问题所进行的交流对话,以及基于笔者经验的一些实际案例,能够适用于资深业务和信息技术经理,企业数据、应用和技术架构师等人群阅读。
《大数据管理:数据集成的技术、方法与最佳实践》是数据集成领域的经典著作,由具有数十年从业经验的资深数据集成专家撰写,数据管理专家作序推荐!它为大数据时代的大中型企业管理企业内部大量的、复杂的应用系统之间的数据提供了解决方案,全面而深入地讲解数据集成的工具、方法、技巧、解决方案以及最佳实践。本书分为四部分,共22章,高屋建瓴地阐述了在大型组织环境中,不同计算机系统之间传输数据,以及将异构数据进行集成所用到的技巧、技术和最佳实践,内容涵盖数据集成导论、批处理数据集成、实时数据集成和大数据集成等。
《大数据管理:数据集成的技术、方法与最佳实践》虽然介绍了各种数据集成问题的多种不同类型的技术解决方案,但读者无需具备广阔的技术背景就能理解,适合数据处理相关的项目经理、数据分析师、数据模型设计师、数据库工作者以及数据集成程序员等相关技术人员及数据管理专业学生阅读。
译者序
序言
前言
第一部分 数据集成导论
第1章 数据集成的重要性
1.1 数据接口的天然复杂性
1.2 购买供应商应用包的数量日益增加
1.3 大数据和虚拟化的催化剂
第2章 什么是数据集成
2.1 运动中的数据
2.2 集成为通用格式—数据转换
2.3 数据从一个系统迁移到另一个系统
2.4 在组织内部移动数据
2.5 从非结构化数据中抽取信息
2.6 将处理移动到数据端
第3章 数据集成的类型和复杂性
3.1 管理运动中的数据和持久化数据的异同点
3.2 批处理数据集成
3.3 实时数据集成
3.4 大数据集成
3.5 数据虚拟化
第4章 数据集成开发过程
4.1 数据集成开发生命周期
4.2 包含业务知识和专家经验
第二部分 批处理数据集成
第5章 批处理数据集成简介
5.1 什么是批处理数据集成
5.2 批处理数据集成生命周期
第6章 抽取、转换和加载
6.1 什么是ETL
6.2 概要分析
6.3 抽取
6.4 暂存
6.5 访问层次
6.6 转换
6.6.1 简单映射
6.6.2 查找表
6.6.3 聚合和规范化
6.6.4 计算
6.7 加载
第7章 数据仓库
7.1 什么是数据仓库
7.2 企业数据仓库架构中的层次
7.2.1 操作型应用层
7.2.2 外部数据
7.2.3 数据仓库中的数据暂存区
7.2.4 数据仓库数据结构
7.2.5 从数据仓库到数据集市或者商务智能层的暂存
7.2.6 商务智能层
7.3 加载到数据仓库中的数据类型
7.3.1 数据仓库中的主数据
7.3.2 数据仓库中的余额和快照数据
7.3.3 数据仓库中的事务型数据
7.3.4 事件
7.3.5 调整
第8章 数据转换
8.1 什么是数据转换
8.2 数据转换生命周期
8.3 数据转换分析
8.4 数据加载最佳实践
8.5 提高源数据质量
8.6 映射到目标系统
8.7 配置数据
8.8 测试和依赖
8.9 私有数据
8.10 校对
8.11 环境
第9章 数据归档
9.1 什么是数据归档
9.2 归档数据选择
9.3 已归档数据可以恢复吗
9.4 归档环境下数据结构的确认
9.5 灵活的数据结构
第10章 批处理数据集成架构和元数据
10.1 什么是批处理数据集成架构
10.2 概要分析工具
10.3 建模工具
10.4 元数据存储库
10.5 数据移动
10.6 转换
10.7 调度
第三部分 实时数据集成
第11章 实时数据集成简介
11.1 为什么需要实时数据集成
11.2 为什么需要两组技术
第12章 数据集成模式
12.1 交互模式
12.2 松耦合
12.3 中心和节点模式
12.4 同步交互和异步交互
12.5 请求和应答
12.6 发布和订阅
12.7 两阶段提交
12.8 集成交互类型
第13章 核心实时数据集成技术
13.1 令人困惑的术语
13.2 企业服务总线
13.3 面向服务架构
13.4 可扩展标记语言
13.5 数据复制和变化数据捕获
13.6 企业应用集成
13.7 企业信息集成
第14章 数据集成建模
14.1 规范化建模
14.2 消息建模
第15章 主数据管理
15.1 主数据管理简介
15.2 需要主数据管理方案的原因
15.3 购买的软件包与主数据
15.4 参考数据
15.5 主和从
15.6 外部数据
15.7 主数据管理功能
15.8 主数据管理方案的类型—注册表以及数据中心
第16章 实时更新数据仓库
16.1 企业信息工厂
16.2 操作型数据存储
16.3 移动到数据仓库的主数据
第17章 实时数据集成架构和元数据
17.1 实时数据集成元数据简介
17.2 建模
17.3 概要分析
17.4 元数据库
17.5 企业服务总线—数据转换和调度
17.5.1 技术中介
17.5.2 业务内容
17.6 数据移动和中间件
17.7 外部交互
第四部分 大数据集成
第18章 大数据集成简介
18.1 数据集成及非结构化数据
18.2 大数据、云数据及数据虚拟化
第19章 云架构和数据集成
19.1 为什么云中的数据集成比较重要
19.2 公共云
19.3 云安全
19.4 云延迟
19.5 云冗余
第20章 数据虚拟化
20.1 恰逢其时的一项技术
20.2 数据虚拟化的商业用途
20.2.1 商务智能方案
20.2.2 集成不同类型的数据
20.2.3 快速向数据仓库中增加或者原型增加数据
20.2.4 将物理上不同的数据一起展现
20.2.5 利用不同的数据和模型触发交易
20.3 数据虚拟化架构
20.3.1 源和适配器
20.3.2 映射、模型和视图
20.3.3 转换和展现
第21章 大数据集成
21.1 什么是大数据
21.2 大数据维度—量
21.2.1 大规模并行处理—将处理过程移动到数据端
21.2.2 Hadoop和MapReduce
21.2.3 与外部数据集成
21.2.4 虚拟化
21.3 大数据维度—多样性
21.3.1 数据类型
21.3.2 集成不同类型的数据
21.4 大数据维度—速度
21.4.1 流式数据
21.4.2 传感器和GPS数据
21.4.3 社会化媒体数据
21.5 传统大数据应用案例
21.6 更多大数据应用案例
21.6.1 医疗
21.6.2 物流
21.6.3 国家安全
21.7 利用大数据的力量—实施决策支持
21.7.1 触发行动
21.7.2 从内存以及磁盘中检索数据的速度
21.7.3 从数据分析到模型,从流式数据到决策
21.8 大数据架构
21.8.1 操作型系统和数据存储
21.8.2 中间数据中心
21.8.3 商务智能工具
21.8.4 数据虚拟化服务器
21.8.5 批处理和实时数据集成工具
21.8.6 分析型沙盒
21.8.7 风险响应系统
第22章 移动数据管理总结
22.1 数据集成架构
22.1.1 为什么需要数据集成架构
22.1.2 数据集成生命周期和专家经验
22.1.3 安全和隐私
22.2 数据集成引擎
22.2.1 操作连贯性
22.2.2 ETL引擎
22.2.3 企业服务总线
22.2.4 数据虚拟化服务器
22.2.5 数据移动
22.3 数据集成中心
22.3.1 主数据
22.3.2 数据仓库和操作型数据存储
22.3.3 企业内容管理
22.3.4 数据归档
22.4 元数据管理
22.4.1 数据发现
22.4.2 数据概要分析
22.4.3 数据建模
22.4.4 数据流建模
22.4.5 元数据存储库
22.5 结束语
参考文献
精品推荐
同类热门
类似软件
DataExplore数据恢复大师6.52M831人在用 DataExplore数据恢复大师是由上海数擎信息科技有限公司推出的一款功能强大的硬盘数据恢复软件。软件提供了较低层次恢复功能,只要硬盘数据没有被覆盖掉,文件就能找得到,支持FAT12/FAT16/FAT32/NTFS/EXT2文件系统,可以导出文
查看大数据时代生活工作与思维的大变革12.82M323人在用大数据时代生活工作与思维的大变革是由“大数据商业应用第一人”的维克托·迈尔·舍恩伯格先生编著,《科学》《自然》等著名学术期刊最推崇的互联网研究者之一,拥有在哈佛大学、牛津大学、耶鲁大学和新加坡国立大学等多个互联网研究重镇任教的经历。《大数据时代:生活、工
查看hadoop大数据分析与挖掘实战38.23M281人在用hadoop大数据分析与挖掘实战是一本Hadoop大数据分析实战书籍,由张良均,樊哲,赵云龙和李成华四人共同编著。本书以大家熟知的Hadoop技术来展开,理论部分介绍了Hadoop生态系统基本原理及常用大数据挖掘建模工具。案例部分以解决某个应用的挖掘目标
查看热门标签
网友评论0人参与,0条评论
最新排行
Oracle PL/SQL专家指南:高级PL/SQL解决方案的设计与开发37.16M哈德门pdf扫描版 Oracle PL/SQL专家指南:高级PL/SQL解决方案的设计与开发是一本Oracle数据库操作指南,由美国程序员哈德门和麦克罗林共同编著。全书内容丰富翔实,主要讲解了统计表收集、PL/SQL优化器、SQL Trace、DBMS STATS及T
查看Android C++高级编程:使用NDK69.44M辛纳pdf扫描版 Android是一个完整的、开放的、免费的移动平台,该平台给移动应用开发者提供了无限的机会。但是如何才能更好的常握好呢?小编推荐大家阅读《android c++高级编程:使用NDK》,这是国内首本基于C++开发android应用书籍,由美国程序员辛
查看android编程实战14.52Mpdf扫描版 android编程实战是一本安卓编程开发实战手册,由瑞典安卓工程师Erik Hellman编著。本书主要针对具有Android应用程序开发经验的读者,读者需要了解Android的基本知识,才能使用Activity、Service、Broadcast
查看vmware vsphere 6.0虚拟化架构实战指南142.67M何坤源pdf扫描版vmware vsphere 6.0虚拟化架构实战指南是一本运维实战图书,由黑色数据网络实验室创始人何坤源。本书完全以真实设备搭建实战环境,以实战为主,理论为辅,具有很强的可操作性,可迅速提高读者的动手能力和技术水平。全书针对企业环境中部署的实际需求,深
查看asp.net4.0从入门到精通79.18M《asp.net4.0从入门到精通》这本图书有多个不同的版本,其中以张正礼,王坚宁编著,清华大学出版社出版的最受读者的欢迎,故小编在此特别提供asp.net4.0从入门到精通pdf免费下载,并且是pdf高清版本哟,用户即下即阅读。该书拥有12个使用asp
查看活出最乐观的自己pdf14.37M扫描版 活出最乐观的自己是由美国著名心理学家马丁.塞利格曼先生编著的一本积极心理学研究著作。该书将深奥的心理学研究与大众的日常生活融合在一起,能够独立帮助读者解决心理学上遇到的各种基础难题,高效、实用! 活出最乐观的自己主要提供了悲观者与乐观者
查看疯狂ajax讲义第三版387.48M李刚pdf扫描版 疯狂ajax讲义第三版是一本介绍Ajax前端开发的图书,也是企业应用前端开发实战指南,由疯狂Java实训营创始人李刚编著。全书名称叫做:疯狂ajax讲义:jQuery/Ext JS/Prototype/DWR企业应用前端开发实战第3版。该书全面、细
查看photoshop cs3用户指南23.71M官方pdf版 本款photoshop cs3用户指南是小编从adobe官方下载的pscs3官方pdf教程,总共包括21个章节,包括快速入门,工作区介绍,打开和导入图像,camera raw,颜色,色彩管理,调整颜色和色调,修饰和变换,选择,图层,绘画,滤镜,文字
查看visual c++程序设计与应用教程第2版32.68M马石安高清扫描版 visual c++程序设计与应用教程第2版是一本高等学校计算机教育实用规划教材,由马石安编著。本书内容丰富翔实,主要围绕两条主线进行编写,一条主要以通俗易懂的语言介绍用Visual C++开发Windows应用程序所必需的应用理论,另一条主线设计
查看游戏编程数学和物理基础pdf54.86M 游戏编程数学和物理基础pdf是“游戏开发技术系列丛书”之一,由斯达乐编著,徐明亮等翻译。本书讨论了三角几何知识,向量和矩阵运算,变换,碰撞和能量,以及1D/2D/3D空间内的运动等内容,循循善诱地指导读者如何利用数学与物理知识达到提升自身游戏开发水
查看深度探索linux操作系统pdf125.28M扫描版 深度探索linux操作系统pdf是一本深度阐释Linux操作系统原理的里程碑之作,由资深linux专家王柏生编著。本书以从零开始构建一个完整的Linux操作系统的过程为依托,宏观上全面厘清了构成Linux操作系统的各个组件以及它们之间的关系,微观上
查看Unity Shader入门精要68.85M冯乐乐pdf扫描版Unity Shader入门精要是一本由百万博客访问量作者冯乐乐编著的Unity Shader经典入门书籍,本书内容独特,填补了Unity Shader和渲染流水线之间的知识鸿沟,对Unity中一些渲染机制的工作原理进行详细剖析,帮助读者解决“是什么”“
查看