大小:15.22M
更新时间:23-09-14
系统:Pc
Apache Kylin是个由中国人主导的Apache项目,apache kylin权威指南则是国内一本由该团队开发的原创图书,全书总共12章,介绍了Apache Kylin的历史、技术原理和产品定位,同时详细解读了Apache Kylin的核心概念,增量构建,流式构建,查询和可视化,Cube优化,应用案例分析,运维管理等内容,帮助用户更深入了解apache kylin,适用于所有的读者使用,欢迎免费下载。
Apache Kylin是Hadoop大数据平台上的一个开源OLAP引擎。它采用多维立方体预计算技术,可以将大数据的SQL查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度,亚秒级别速度是百倍到千倍的提升,该引擎为超大规模数据集上的交互式大数据分析打开了大门。
Apache Kylin也是中国人主导的、唯一的Apache顶级开源项目,在开源社区有世界级的影响力。
《apache kylin权威指南》第1章介绍ApacheKylin的历史、技术原理和产品定位,帮助用户了解何时和为何使用Kylin。第2章通过一个具体的案例快速入门,讲解Kylin核心概念、Cube建模和SQL连接查询这些基本使用。第3、4章讲解增量构建和进一步的流式构建,是大多数案例典型配置。第5、6章是针对查询和可视化、Cube调优的两个专门章节,适合较高级的用户。第7章是一系列有行业特点的具体案例分析,贯穿之前的所有概念。第8、9章讲ApacheKylin的扩展和企业级高级功能,技术性较强,会有较多的代码示例。第10章讲运维管理,从安装配置、监控维护到常见的问题和修复。全书后两章谈ApacheKylin开源社区和项目发展规划。
《apache kylin权威指南》由李扬为首的麒麟技术团队撰写。团队是Apache Kylin的主创团队,是了解麒麟技术的一个团队。
李扬是大数据架构师和工程师,专注大数据分析技术。他是Apache Kylin管理委员会成员,也是Kyligence Inc.(一家专业提供大数据商务智能服务的创业公司)创始人之一。李扬是Apache Kylin主创团队的架构师和技术负责人,在eBay期间开始开发Kylin项目。之前,李扬在IBM工作8年,在摩根士丹利工作2年。在IBM期间,他是“杰出技术贡献奖”的获奖者,曾担任InfoSphere BigInsights的技术负责人,负责Hadoop开源产品架构。在摩根士丹利期间,李扬担任副总裁,负责全球监管报表基础架构。
推荐序一 推荐序二 推荐序三 推荐序四 前言 第1章 Apache Kylin概述 1.1 背景和历史 1.2 Apache Kylin的使命 1.2.1 为什么要使用Apache Kylin 1.2.2 Apache Kylin怎样解决关键问题 1.3 Apache Kylin的工作原理 1.3.1 维度和度量简介 1.3.2 Cube和Cuboid 1.3.3 工作原理 1.4 Apache Kylin的技术架构 1.5 Apache Kylin的主要特点 1.5.1 标准SQL接口 1.5.2 支持超大数据集 1.5.3 亚秒级响应 1.5.4 可伸缩性和高吞吐率 1.5.5 BI及可视化工具集成 1.6 与其他开源产品比较 1.7 小结 第2章 快速入门 2.1 核心概念 2.1.1 数据仓库、OLAP与BI 2.1.2 维度和度量 2.1.3 事实表和维度表 2.1.4 Cube、Cuboid和Cube Segment 2.2 在Hive中准备数据 2.2.1 星形模型 2.2.2 维度表的设计 2.2.3 Hive表分区 2.2.4 了解维度的基数 2.2.5 Sample Data 2.3 设计Cube 2.3.1 导入Hive表定义 2.3.2 创建数据模型 2.3.3 创建Cube 2.4 构建Cube 2.4.1 全量构建和增量构建 2.4.2 历史数据刷新 2.4.3 合并 2.5 查询Cube 2.6 SQL参考 2.7 小结 第3章 增量构建 3.1 为什么要增量构建 3.2 设计增量Cube 3.2.1 设计增量Cube的前提 3.2.2 增量Cube的创建 3.3 触发增量构建 3.3.1 Web GUI触发 3.3.2 构建相关的Rest API 3.4 管理Cube碎片 3.4.1 合并Segment 3.4.2 自动合并 3.4.3 保留Segment 3.4.4 数据持续更新 3.5 小结 第4章 流式构建 4.1 为什么要流式构建 4.2 准备流式数据 4.2.1 数据格式 4.2.2 消息队列 4.2.3 创建Schema 4.3 设计流式Cube 4.3.1 创建Model 4.3.2 创建Cube 4.4 流式构建原理 4.5 触发流式构建 4.5.1 单次触发 4.5.2 自动化多次触发 4.5.3 出错处理 4.6 小结 第5章 查询和可视化 5.1 Web GUI 5.1.1 查询 5.1.2 显示结果 5.2 Rest API 5.2.1 查询认证 5.2.2 查询请求参数 5.2.3 查询返回结果 5.3 ODBC 5.4 JDBC 5.4.1 获得驱动包 5.4.2 认证 5.4.3 URL格式 5.4.4 获取元数据信息 5.5 通过Tableau访问Kylin 5.5.1 连接Kylin数据源 5.5.2 设计数据模型 5.5.3 通过Live方式连接 5.5.4 自定义SQL 5.5.5 可视化 5.5.6 发布到Tableau Server 5.6 Zeppelin集成 5.6.1 Zeppelin架构简介 5.6.2 KylinInterpreter的工作原理 5.6.3 如何使用Zeppelin访问Kylin 5.7 小结 第6章 Cube优化 6.1 Cuboid剪枝优化 6.1.1 维度的诅咒 6.1.2 检查Cuboid数量 6.1.3 检查Cube大小 6.1.4 空间与时间的平衡 6.2 剪枝优化的工具 6.2.1 使用衍生维度 6.2.2 使用聚合组 6.3 并发粒度优化 6.4 Rowkeys优化 6.4.1 编码 6.4.2 按维度分片 6.4.3 调整Rowkeys顺序 6.5 其他优化 6.5.1 降低度量精度 6.5.2 及时清理无用的Segment 6.6 小结 第7章 应用案例分析 7.1 基本多维分析 7.1.1 数据集 7.1.2 数据导入 7.1.3 创建数据模型 7.1.4 创建Cube 7.1.5 构建Cube 7.1.6 SQL查询 7.2 流式分析 7.2.1 Kafka数据源 7.2.2 创建数据表 7.2.3 创建数据模型 7.2.4 创建Cube 7.2.5 构建Cube 7.2.6 SQL查询 7.3 小结 第8章 扩展Apache Kylin 8.1 可扩展式架构 8.1.1 工作原理 8.1.2 三大主要接口 8.2 计算引擎扩展 8.2.1 EngineFactory 8.2.2 MRBatchCubingEngine2 8.2.3 BatchCubingJobBuilder2 8.2.4 IMRInput 8.2.5 IMROutput2 8.3 数据源扩展 8.4 存储扩展 8.5 聚合类型扩展 8.5.1 聚合的JSON定义 8.5.2 聚合类型工厂 8.5.3 聚合类型的实现 8.6 维度编码扩展 8.6.1 维度编码的JSON定义 8.6.2 维度编码工厂 8.6.3 维度编码的实现 8.7 小结 第9章 Apache Kylin的企业级功能 9.1 身份验证 9.1.1 自定义验证 9.1.2 LDAP验证 9.1.3 单点登录 9.2 授权 9.3 小结 第10章 运维管理 10.1 安装和配置 10.1.1 必备条件 10.1.2 快速启动Apache Kylin 10.1.3 配置Apache Kylin 10.1.4 企业部署 10.2 监控和诊断 10.2.1 日志 10.2.2 任务报警 10.2.3 诊断工具 10.3 日常维护 10.3.1 基本运维 10.3.2 元数据备份 10.3.3 元数据恢复 10.3.4 系统升级 10.3.5 垃圾清理 10.4 常见问题和修复 10.5 获得社区帮助 10.5.1 邮件列表 10.5.2 JIRA 10.6 小结 第11章 参与开源 11.1 Apache Kylin的开源历程 11.2 为什么参与开源 11.3 Apache开源社区简介 11.3.1 简介 11.3.2 组织构成与运作模式 11.3.3 项目角色 11.3.4 孵化项目及顶级项目 11.4 如何贡献到开源社区 11.4.1 什么是贡献 11.4.2 如何贡献 11.5 礼仪与文化 11.6 如何参与Apache Kylin 11.7 小结 第12章 Apache Kylin的未来 12.1 大规模流式构建 12.2 拥抱Spark技术栈 12.3 更快的存储和查询 12.4 前端展现及与BI工具的整合 12.5 高级OLAP函数 12.6 展望
应用信息
同类热门
类似软件
Apache Tomcat 6高级编程89.97M216人在用Apache Tomcat 6高级编程是一本Apache Tomcat 6编著书籍,由乔帕(Chopra V.)编著,杨金奎等人翻译。本书重点讲解Tomcat 6的应用知识,介绍了新的架构和性能更改。从基本的Tomcat和Web应用程序配置到用于集群、J
查看
Apache tomcat 1014M784人在用 Apache tomcat 10是一个免费的开放源代码的Web应用服务器,因而深受Java爱好者的喜爱并得到了部分软件开发商的认可,被很多企业普遍使用,也是开发和调试JSP程序的首选,成为目前比较流行的Web应用服务器。而对于一个初学者来说,可以这
查看
apache spark 源码剖析30.99M185人在用apache spark 源码剖析是一本Spark代码源码学习书籍,由许鹏编著,本书全面、系统地介绍了Spark源码,深入浅出,细致入微。先提供给读者一系列分析源码的实用技巧,并给出一个合理的阅读顺序,并且始终抓住资源分配、消息传递、容错处理等基本问题,
查看热门标签
网友评论0人参与,0条评论
最新排行
12j201平屋面建筑构造图集6.71Mpdf电子版 12j201图集是中华人民共和国住房和城乡建设部发行一本国家建筑标准设计图集,全称叫做12j201平屋面建筑构造图集。自2012日起实施,原《室外工程)) (02J003) 《平屋面建筑构造(一))) (含 2003 年局部修改版) [99J201
查看
excel实战技巧精粹pdf版77.45M Excel实战技巧精粹PDF是一本主要讲述关于Excel经验的PDF文档,该书通过对Excel技术论坛上上百万提问的分析与提炼,汇集了用户在使用Excel过程中最常见的需求,通过几百万个示例的演示与讲解,将Excel高手的过人技巧手把手交给读者,并
查看
精通Java Web整合开发(第二版)225.47M刘斌 pdf扫描版 精通Java Web整合开发(第二版)是一本Java Web技术整合开发书籍,由刘斌编著。本书为轻量级Java EE应用开发人员提供一整套实用的主流开发技术,融入了作者多年的Java EE应用开发经验。任何知识点均配以实例进行讲解,每个实例提供同步
查看
asp.net mvc 4 web编程57.93Masp.net mvc 4 web编程是一本pdf高清扫描版的电子图书,是NET开发者学习MVC的必备圣典。由Jess cbadwick,todd snyder,hrusikesb panda著,徐雷,徐扬翻译。全书介绍介绍了微软最新的ASP.NET M
查看
android 4游戏编程入门经典pdf3.55M高清扫描版《android 4游戏编程入门经典》是专为游戏开发的初学者量身打造的一款android开发入门教程,作者[美]Mario Zechner和Robert Green,曾繁贰、于建业和王炜译,清华大学出版社出版。全书最大亮点是:它教你如何从零开始学习and
查看
程序员藏经阁:C#编程兵书195.92M张志强pdf扫描版 C#编程兵书是一本C语言设计开发手册,由张志强和胡军两人共同编著。本书内容丰富,全面介绍了C#语言基础,并以示例形式介绍了C#语言的编程技术和开发过程。从细节到整体,从内容编排到目录组织,本书都力求合理。在每一小节的内容编排上,首先给出清晰易懂的基
查看
html5+javascript动画基础52.79Mpdf高清扫描版html5+javascript动画基础是一本教你如何使用HTML5和JavaScript来完成一系列的动画特效的教学书籍,由[美]billy lamberta,Keith Peters著,徐宁,李强翻译,人民邮电出版社出版。全书详细介绍了如何使用HTM
查看
电路第五版邱关源课后答案详解pdf5.2M高清电子版电路第五版邱关源课后答案详解全称叫做电路第5版学习指导与习题分析,由刘崇新,罗先觉著,是电路第五版配套用书,主要面向学生和自学读者。全书内容次序与电路第5版一致,每章包括重点和难点,学习方法指导,典型例题和习题解答,有助于学生理解基本概念,掌握基本原理和
查看
SEO实战指导:知识策略案例(第2版)42.6M扫描版 SEO实战指导:知识策略案例(第2版)是一本搜索引擎优化学习教材,由藏锋者和郝永清两人共同编著。全书脉络简单,化繁为简,将纷繁复杂的搜索引擎优化技术(seo)进行提炼和梳理,从理论技术介绍到实际案例操作,进行细致详尽的讲解和分析,让读者很快就可以了
查看
深入浅出android软件开发教程53.59M张雪梅高凯pdf扫描版 深入浅出android软件开发教程是一本学习Android程序设计非常实用的教材,由张雪梅和高凯两人共同编著。本书配有丰富的示例程序,讲解深入浅出,可以帮助初学者在较短的时间内掌握Android软件的开发方法。示例程序短小精悍,既能帮助读者理解知识
查看
javase基础教程940KPDF版 本次给大家分享的javase教程是针对刚接触java的朋友所提供的教程文件,该文件是PDF格式,用户必须在本地安装PDF阅读器才能正常阅读。javase基础教程中都是老鸟们的经验之谈,提供了JavaSE基本知识点、UML建模、单元测试等内容,相信绝
查看
sql server 2005安装图解5.26Mpdf高清版 SQL Server 2005是目前网络上使用率最高的数据库,虽然高版本的sql能够带给用户带多新功能,但迁移数据库以及熟练操作也需要一段时间,故此SQL Server 2005还是非常有市场的,本站在这里提供sql server 2005安装图解
查看