0

0

mysql多维数据仓库指南是什么

(*-*)浩

(*-*)浩

发布时间:2019-05-09 15:03:14

|

2763人浏览过

|

来源于php中文网

原创

mysql多维数据仓库指南是一个实战的书籍。你将使用mysql数据库,但该书不是关于mysql的。本书不涉及任何硬件架构方面的问题。  本书主要关心数据仓库的设计和开发技术。欢迎使用  mysql多维数据仓库指南。

推荐课程:MySQL教程

mysql多维数据仓库指南是什么

数据仓库可以通过集成各种多样的数据实现信息的统一,这些数据来源包括现行的事务操作和管理信息系统,以及外部各种信息源。这些源数据将被整合,清洗,转换,如果需要直接从这些数据来源读取数据的话,该数据将会在数据仓库中以更有利于操作的方式存储。

数据仓库的数据构造方式使你可以存储当前和历史的数据。当前数据是实际事务操作活动必要的,一般是定期的硬拷贝(比如打印出的报表)或者是联机报表。而历史数据,往往不是那么容易利用,可以提供基于时间点分析的商业信息,比如:追踪、推论分析,以及对比,这些对于长期计划和战略性的市场决策都是很重要的。

如何从多个信息源整合信息,定期积聚存储,有效的需求设计和发展技术,所有这些都和事务型管理信息系统所应用的技术有很大的不同。本书都是关于数据仓库的设计和开发技术,它涵盖了大部分建立数据仓库所涉及到的大部分技术问题。更为重要的是,本书提供了一个易懂的操作指南,便于开发一个实际的数据仓库。

本书的适用范围

mysql多维数据仓库指南是一个实战的书籍。你将使用mysql数据库,但该书不是关于mysql的。本书不涉及任何硬件架构方面的问题。

本书主要关心数据仓库的设计和开发技术。它不涉及开发项目的管理,理论,以及如何领导开发等相关的技术问题。

本书用一个数据仓库开发的例子来展示技术如何应用。提供数据模型和sql脚本,将能够适用于实际的数据仓库开发。这些脚本已经在Windows xp professional sp2 平台上用mysql 5。0。21 版本测试通过。

另外,本书不再对以下的几个主题进行特别的论述:

数据仓库的概念

Sql

MySQL数据库

适合阅读本书的人:

数据仓库应用于各种组织和商业机构,从政府部门,非盈利组织到学校,从制造业到零售店,从金融机构到医疗机构,从传统公司到互联网商家。

本书首先面向数据仓库开发人员。但是,it 经理和其他it职业,特别是那些对mis(经营报告)和dss(决策支撑应用)感兴趣的人将发现本书同样有用。总的说来,本书是给那些为分析应用准备数据工作相关的人,以及那些需要递交信息的人,比如打印报表,联机报表。

本书同样适用于那些数据仓库初学者。它将直接快速的为那些正在准备开发他们第一个数据仓库的人提供帮助。

教师和学生可以将该书作为教科书,以便于明确他们对于数据仓库原理,概念的理解。大部分章节可以被定制用于实验练习。

预备的技能

本书不是面向it新人,为了更有效的利用本书,读者必须有一些系统开发经验。但是,不要求先有数据仓库的建设经验。

需要实践操作本书例子的人需要有rdbms(关系数据库管理系统)和sql的实际操作技能。

你可以从本书得到

你将可以仅仅用一个示例,一个最先存储商业销售相关数据的数据仓库,并且进行实践操作,就可以磨练你的数据仓库知识和实际技能。该示例是一个精简版的实际数据仓库,可以在很多种商业类型中找到它的原型。

你将基于mysql数据库用本书介绍的技术一步步的开发该示例中销售相关数据仓库。这些技术是在通常数据仓库开发中将碰到的问题的分解技巧。通过完成本文的学习并且完成所有的练习,你将获得相关工作经验并可以为负责第一个实际数据仓库项目做好准备。

章节总览

本书包含25个章节和一个附录。所有章节组织为四个部分。第一部分涵盖数据仓库基础。第二部分描述从原始数据到数据仓库的迁移。第三部分讨论如何控制数据仓库的发展演化。第四部分涉及到一些高级的多维技术。接下来的部分将给出每个章节的预览。

第一篇 基本原理

第一篇,涵盖多维数据仓库的基础原理,有四个章节。

第1章,“基本组成”,介绍星型模式(一种数据库模式,有一个事实表,周围围绕着多个维表)以及解释该模式的基本组成。

第2章,”维度历史“ 介绍用代理健来维护维成员的历史记录。

第3章,“度量可加性”,包含维度数据仓库中最重要的特性之一,也就是存储在数据仓库事实表中的度量的可加性。

第4章,“维度查询”,介绍最适合应用于星型模式的一种sql查询,维度查询可以用来证明一个维度数据仓库是否具备两个最基本的设计指标:简单和高效。

Tellers AI
Tellers AI

Tellers是一款自动视频编辑工具,可以将文本、文章或故事转换为视频。

下载

第二篇: 提取、转换和加载

该篇的所有5个章节涉及了数据集成,事实表,维表。

第5章,“源数据提取”介绍了不同类型数据的提取。

第6章“导入时间维”涵盖了三种最通用的加载时间维的技术。

第7章 “初始化导入“和第8章,“定期导入”涉及到两种类型的导入技术,初始化和周期性。

第9章,“周期导入计划”,作为第二篇的总结,提供一个进阶式的指导,关于如何利用Windows的任务管理器实现定期导入计划。

第三篇:成长

第三篇介绍了不同的处理技术,这些技术主要处理一个成功的多维数据仓库成长过程中碰到的相关问题。该部分有十个章节。

 第10章,“增加字段”讨论关于向现有数据仓库中的表增加一个字段的技术问题。

第11章,“按需载入”涉及按需载入的技术。

第12章,“维表子集”,介绍相关技术以帮助用户处理维表子集问题。

第13章,“维度角色扮演”,关于在一个事实表中多次使用同一个维度的问题。

第14章,“快照”让你在需要作出汇总数据的时候,能提供快速性能的查询。

第15章,“唯度层次”和第16章“多路径和不齐整的维度层次”是关于简单和多路径维度技术,相应的,这些技术帮助人们进行汇聚和钻取分析。

第17章,“维度退化”,展示了如何用维度退化技术去减少一个数据仓库模式的复杂性。

 第18章,“垃圾维”,是关于垃圾维的技术,即将表面上不相关的但是经常会被用户进行要求分析的数据,用维的方式组织起来。

第19章,“多星型模式”展示了如何在模式中增加多个星型模式。

第四篇:高级技术

包含六个章节。

第20章,“不齐整数据源”,介绍如何在数据仓库中处理那些结构无法直接映射到目标表的数据源。

第21章,“无事实的事实表”,帮助你为客户建立一种可供分析的辅助数据,一种无事实字段的事实表,该数据无法从数据源直接取得度量。

第22章,“迟来的事实”,包含一个技术,用于处理当数据源中某个特殊的事实没有在计划载入时间之前产生的情况。

第23章,“外部数据源和维度合并“,包括两个主题:处理外部数据源和如何将多个维中分散的属性合并到一个维的技术。

第24章,“累积度量”,讨论两个相关的问题:计算度量和累积度量的不可相加性。

第25章,“分段维度”,阐述一种技术,可以帮助使用者针对那些有连续值的属性进行数据分析。

附录

附录a,“格式文件数据源”,介绍如何使用本书例子中的格式文件数据源。

将Mysql这个最流行的开源数据库软件进行数据仓库应用,在本书之前还从来没有被在创建多维数据仓库方面用这种入门指南的方式进行介绍。主题包括 星型模式建模,数据载入(数据的提取、转换和加载:etl),测试检验,以及多维查询。本书由始至终应用一个可实践,相对精简的真实的项目。其全面,易于接受的写作形式使得那些需要建立数据仓库的程序员可以得到相关的示例和资料。

关于作者

Djoni Darmawikarta 曾就职于ibm,现在是一个加拿大保险公司的数据仓库、商业智能团队中的技术专家。目前生活在Toronto, Ontario

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

683

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

322

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

348

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1095

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

358

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

677

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

575

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

417

2024.04.29

Java JVM 原理与性能调优实战
Java JVM 原理与性能调优实战

本专题系统讲解 Java 虚拟机(JVM)的核心工作原理与性能调优方法,包括 JVM 内存结构、对象创建与回收流程、垃圾回收器(Serial、CMS、G1、ZGC)对比分析、常见内存泄漏与性能瓶颈排查,以及 JVM 参数调优与监控工具(jstat、jmap、jvisualvm)的实战使用。通过真实案例,帮助学习者掌握 Java 应用在生产环境中的性能分析与优化能力。

19

2026.01.20

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.8万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 802人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号