apache kylin权威指南 pdf-apache kylin权威指南下载 pdf高清版

详情
相关
评论

Apache Kylin是个由中国人主导的Apache项目，apache kylin权威指南则是国内一本由该团队开发的原创图书，全书总共12章，介绍了Apache Kylin的历史、技术原理和产品定位，同时详细解读了Apache Kylin的核心概念，增量构建，流式构建，查询和可视化，Cube优化，应用案例分析，运维管理等内容，帮助用户更深入了解apache kylin，适用于所有的读者使用，欢迎免费下载。

Apache Kylin简介

Apache Kylin是Hadoop大数据平台上的一个开源OLAP引擎。它采用多维立方体预计算技术，可以将大数据的SQL查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度，亚秒级别速度是百倍到千倍的提升，该引擎为超大规模数据集上的交互式大数据分析打开了大门。

Apache Kylin也是中国人主导的、唯一的Apache顶级开源项目，在开源社区有世界级的影响力。

内容简介

《apache kylin权威指南》第1章介绍ApacheKylin的历史、技术原理和产品定位，帮助用户了解何时和为何使用Kylin。第2章通过一个具体的案例快速入门，讲解Kylin核心概念、Cube建模和SQL连接查询这些基本使用。第3、4章讲解增量构建和进一步的流式构建，是大多数案例典型配置。第5、6章是针对查询和可视化、Cube调优的两个专门章节，适合较高级的用户。第7章是一系列有行业特点的具体案例分析，贯穿之前的所有概念。第8、9章讲ApacheKylin的扩展和企业级高级功能，技术性较强，会有较多的代码示例。第10章讲运维管理，从安装配置、监控维护到常见的问题和修复。全书后两章谈ApacheKylin开源社区和项目发展规划。

作者简介

《apache kylin权威指南》由李扬为首的麒麟技术团队撰写。团队是Apache Kylin的主创团队，是了解麒麟技术的一个团队。

李扬是大数据架构师和工程师，专注大数据分析技术。他是Apache Kylin管理委员会成员，也是Kyligence Inc.（一家专业提供大数据商务智能服务的创业公司）创始人之一。李扬是Apache Kylin主创团队的架构师和技术负责人，在eBay期间开始开发Kylin项目。之前，李扬在IBM工作8年，在摩根士丹利工作2年。在IBM期间，他是“杰出技术贡献奖”的获奖者，曾担任InfoSphere BigInsights的技术负责人，负责Hadoop开源产品架构。在摩根士丹利期间，李扬担任副总裁，负责全球监管报表基础架构。

apache kylin权威指南章节目录

推荐序一
推荐序二
推荐序三
推荐序四
前言
第1章 Apache Kylin概述
1.1 背景和历史
1.2 Apache Kylin的使命
1.2.1 为什么要使用Apache Kylin
1.2.2 Apache Kylin怎样解决关键问题
1.3 Apache Kylin的工作原理
1.3.1 维度和度量简介
1.3.2 Cube和Cuboid
1.3.3 工作原理
1.4 Apache Kylin的技术架构
1.5 Apache Kylin的主要特点
1.5.1 标准SQL接口
1.5.2 支持超大数据集
1.5.3 亚秒级响应
1.5.4 可伸缩性和高吞吐率
1.5.5 BI及可视化工具集成
1.6 与其他开源产品比较
1.7 小结
第2章 快速入门
2.1 核心概念
2.1.1 数据仓库、OLAP与BI
2.1.2 维度和度量
2.1.3 事实表和维度表
2.1.4 Cube、Cuboid和Cube Segment
2.2 在Hive中准备数据
2.2.1 星形模型
2.2.2 维度表的设计
2.2.3 Hive表分区
2.2.4 了解维度的基数
2.2.5 Sample Data
2.3 设计Cube
2.3.1 导入Hive表定义
2.3.2 创建数据模型
2.3.3 创建Cube
2.4 构建Cube
2.4.1 全量构建和增量构建
2.4.2 历史数据刷新
2.4.3 合并
2.5 查询Cube
2.6 SQL参考
2.7 小结
第3章 增量构建
3.1 为什么要增量构建
3.2 设计增量Cube
3.2.1 设计增量Cube的前提
3.2.2 增量Cube的创建
3.3 触发增量构建
3.3.1 Web GUI触发
3.3.2 构建相关的Rest API
3.4 管理Cube碎片
3.4.1 合并Segment
3.4.2 自动合并
3.4.3 保留Segment
3.4.4 数据持续更新
3.5 小结
第4章 流式构建
4.1 为什么要流式构建
4.2 准备流式数据
4.2.1 数据格式
4.2.2 消息队列
4.2.3 创建Schema
4.3 设计流式Cube
4.3.1 创建Model
4.3.2 创建Cube
4.4 流式构建原理
4.5 触发流式构建
4.5.1 单次触发
4.5.2 自动化多次触发
4.5.3 出错处理
4.6 小结
第5章 查询和可视化
5.1 Web GUI
5.1.1 查询
5.1.2 显示结果
5.2 Rest API
5.2.1 查询认证
5.2.2 查询请求参数
5.2.3 查询返回结果
5.3 ODBC
5.4 JDBC
5.4.1 获得驱动包
5.4.2 认证
5.4.3 URL格式
5.4.4 获取元数据信息
5.5 通过Tableau访问Kylin
5.5.1 连接Kylin数据源
5.5.2 设计数据模型
5.5.3 通过Live方式连接
5.5.4 自定义SQL
5.5.5 可视化
5.5.6 发布到Tableau Server
5.6 Zeppelin集成
5.6.1 Zeppelin架构简介
5.6.2 KylinInterpreter的工作原理
5.6.3 如何使用Zeppelin访问Kylin
5.7 小结
第6章 Cube优化
6.1 Cuboid剪枝优化
6.1.1 维度的诅咒
6.1.2 检查Cuboid数量
6.1.3 检查Cube大小
6.1.4 空间与时间的平衡
6.2 剪枝优化的工具
6.2.1 使用衍生维度
6.2.2 使用聚合组
6.3 并发粒度优化
6.4 Rowkeys优化
6.4.1 编码
6.4.2 按维度分片
6.4.3 调整Rowkeys顺序
6.5 其他优化
6.5.1 降低度量精度
6.5.2 及时清理无用的Segment
6.6 小结
第7章 应用案例分析
7.1 基本多维分析
7.1.1 数据集
7.1.2 数据导入
7.1.3 创建数据模型
7.1.4 创建Cube
7.1.5 构建Cube
7.1.6 SQL查询
7.2 流式分析
7.2.1 Kafka数据源
7.2.2 创建数据表
7.2.3 创建数据模型
7.2.4 创建Cube
7.2.5 构建Cube
7.2.6 SQL查询
7.3 小结
第8章 扩展Apache Kylin
8.1 可扩展式架构
8.1.1 工作原理
8.1.2 三大主要接口
8.2 计算引擎扩展
8.2.1 EngineFactory
8.2.2 MRBatchCubingEngine2
8.2.3 BatchCubingJobBuilder2
8.2.4 IMRInput
8.2.5 IMROutput2
8.3 数据源扩展
8.4 存储扩展
8.5 聚合类型扩展
8.5.1 聚合的JSON定义
8.5.2 聚合类型工厂
8.5.3 聚合类型的实现
8.6 维度编码扩展
8.6.1 维度编码的JSON定义
8.6.2 维度编码工厂
8.6.3 维度编码的实现
8.7 小结
第9章 Apache Kylin的企业级功能
9.1 身份验证
9.1.1 自定义验证
9.1.2 LDAP验证
9.1.3 单点登录
9.2 授权
9.3 小结
第10章 运维管理
10.1 安装和配置
10.1.1 必备条件
10.1.2 快速启动Apache Kylin
10.1.3 配置Apache Kylin
10.1.4 企业部署
10.2 监控和诊断
10.2.1 日志
10.2.2 任务报警
10.2.3 诊断工具
10.3 日常维护
10.3.1 基本运维
10.3.2 元数据备份
10.3.3 元数据恢复
10.3.4 系统升级
10.3.5 垃圾清理
10.4 常见问题和修复
10.5 获得社区帮助
10.5.1 邮件列表
10.5.2 JIRA
10.6 小结
第11章 参与开源
11.1 Apache Kylin的开源历程
11.2 为什么参与开源
11.3 Apache开源社区简介
11.3.1 简介
11.3.2 组织构成与运作模式
11.3.3 项目角色
11.3.4 孵化项目及顶级项目
11.4 如何贡献到开源社区
11.4.1 什么是贡献
11.4.2 如何贡献
11.5 礼仪与文化
11.6 如何参与Apache Kylin
11.7 小结
第12章 Apache Kylin的未来
12.1 大规模流式构建
12.2 拥抱Spark技术栈
12.3 更快的存储和查询
12.4 前端展现及与BI工具的整合
12.5 高级OLAP函数
12.6 展望

使用说明

1、下载并解压，得出pdf文件

2、如果打不开本文件，请务必下载pdf阅读器

3、安装后，在打开解压得出的pdf文件

4、双击进行阅读

应用信息

语言简体中文

粤教翔云数字教材应用平台教师端249.53Mv3.1.22.5 粤教翔云数字教材应用平台是专为学生用户而打造的学习软件，在这里有着小学到高中各阶段的所有学科知识点，提供了课后练习题、视频课程等学习资源，用户可以通过此软件足不出户学习各种课程知识，从而大大提升自主学习的效率和效果。而且，软件整合了权威、优质、基础
查看
开课啦直播电脑版66.4Mv1.7.4是一款专业强大的在线学习软件
查看
VIPKID学习中心官方版141.86Mv3.20.2少儿英语教学软件
查看
嘉嘉打字成绩管理系统3.28Mv3.0绿色版 嘉嘉打字成绩管理系统是一款相对简单的打字学习软件。它主要提供了查看成绩、整理成绩、过关成绩表、成绩总表、学生资料表、数据备份、数据恢复和清空数据等应用模块，具有使用灵活，操作实用，管理合理的特色，可以通过学生日常打字成绩了解其当前学习状态，及时调整
查看
小可数学出题器10.46Mv3.2 小可数学出题器是专为家长和老师们的一款题目生成器，绿色小巧，易携带易使用。用户只需要在该软件自定义设置下需要的练习题号、运算元数、运算范围、运算符等题目条件信息即可快速的随机的生成题目，同时至此在线浏览全部题目，觉得可以即可进行打印，从而得到一堆练
查看
掌通视频电脑版43.18Mv2.3.20.0官方版支持自动搜索检测局域网中神州鹰IPC。
查看
数学插图(绘图辅助软件)12.41Mv2.0官方版专业强大的绘画辅助工具
查看
熊猫识字电脑版22.74Mv6.2官方版幼儿识字早教软件
查看
超越平凡的平面设计版式设计原理与应用38.98M是一款能够实现对平面设计流程完善的控制
查看
奇迹英语背单词8219.31M 奇迹英语背单词是由时代先锋软件推出的一款功能丰富，简单高效的英语背单词软件。它凝聚了神经心理学、心理物理学、统计心理学、大脑电磁构像学、神经发育与特殊教育等多学科领域的研究成果。能模拟人脑吸收知识的动态过程，包含了一个记忆过程优化器来优化学习记忆的
查看
报任安书ppt课件815K 《报任安书》是西汉文学家司马迁写给友人任安的一封书信，其主要以激愤的心情，陈述了自己的不幸遭遇，抒发了内心的痛苦，以及坚持要完成《史记》一书的决心。而报任安书ppt课件正是针对于这篇被人教版语文必修六课文《报任安书》所设计的一款通用P
查看
可可英语电脑版官方版63.93Mv1.3.7官方版学生和白领必备的英语学习利器
查看
apache kylin权威指南15.22Mpdf高清版 Apache Kylin是个由中国人主导的Apache项目，apache kylin权威指南则是国内一本由该团队开发的原创图书，全书总共12章，介绍了Apache Kylin的历史、技术原理和产品定位，同时详细解读了Apache Kylin的核心概
查看
html5权威指南电子书136.66Mpdf扫描版HTML5致力于为互联网开发者搭建更加便捷、开放的沟通平台，但如何入门呢？小编这里推荐用户阅读html5权威指南，这是一本html5语言的权威使用指南，也是全面详实的web网页设计参考书，贴心汇聚HTML5和CSS3 JavaScript，由美国程序员弗
查看
c++从入门到精通(第2版)156.72M明日科技pdf扫描版 c++从入门到精通第2版是一本c++编程语言的入门书籍，由明日科技C程序开发团队组织编写数十名程序员编著。本书内容由浅入深，循序渐进，以初中级程序员为对象，先从C语言基础学起，再学习C语言的程序结构，然后学习C语言的高级应用，最后学习开发一个完整的
查看