什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些

什么是联机分析处理?

OLAP是一种允许用户同时分析来自多个数据库系统的信息的软件。它是一种允许分析人员从不同的角度提取和查看业务数据的技术。OLAP代表在线分析处理。

分析人员经常需要对数据进行分组、聚合和连接。关系数据库中的这些操作是资源密集型的。使用OLAP数据可以预计算和预聚合,使分析更快。

OLAP数据库被划分为一个或多个数据集。多维数据集的设计使得创建和查看报表变得非常容易。

目录

  • 什么是联机分析处理?
  • OLAP多维数据集
  • OLAP的基本分析操作
  • OLAP系统的类型
  • ROLAP
  • MOLAP
  • 混合OLAP
  • OLAP的优点
  • OLAP的缺点

OLAP多维数据集:

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

OLAP的核心概念是OLAP多维数据集。OLAP多维数据集是一种为非常快速的数据分析而优化的数据结构。

OLAP多维数据集由称为度量的数字事实组成,度量按维度分类。OLAP多维数据结构也称为超立方体数据结构。

通常,数据操作和分析使用简单的电子表格执行,其中数据值以行和列格式排列。这对于二维数据非常理想。然而,OLAP包含多维数据,数据通常来自不同且不相关的源。使用电子表格不是最佳选择。多维数据集可以逻辑有序地存储和分析多维数据。

它是如何工作的?

数据仓库可以从多个数据源和格式(如文本文件、excel表格、多媒体文件等)中提取信息。

提取的数据被清洗和转换。数据被加载到OLAP服务器(或OLAP多维数据集)中,在其中预先计算信息以进行进一步分析。

OLAP的基本分析操作

OLAP中的四种分析操作是:

  1. Roll-up
  2. Drill-down
  3. Slice and dice
  4. Pivot (rotate)

1) Roll-up:

Roll-up也称为“整合”或“聚合”。Roll-up 操作可以通过两种方式执行:

  • 减少尺寸
  • 提升概念层次。概念层次结构是根据事物的顺序或层次对其进行分组的系统。

观察下面的图表

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

  • 在这个例子中,城市新泽西失去了盎格鲁,进入了美国乡村
  • 新泽西和洛杉矶的销售数字分别是440和1560。卷起后变成2000
  • 在这个聚合过程中,数据是位置层次结构从城市向上移动到乡村。
  • 在卷取过程中,至少需要删除一个或多个维度。在本例中,删除了四分之一维度。

2) Drill-down

在drill-down中,数据被分割成更小的部分。它与roll-up过程相反。这可以通过

  • 向下移动概念层次结构
  • 增加一个维度

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

考虑上面的图表

  • 第一季度钻取到一月、二月和三月。相应的销售也是寄存器。
  • 在本例中,添加了维度月份。

3) Slice:

这里,选择一个维度,并创建一个新的子多维数据集。

下图解释了切片操作是如何执行的:

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

  • 时间参数设置为Q1作为过滤器进行切片。
  • 将完全创建一个新的多维数据集。

Dice:

这个操作类似于切片。dice的不同之处在于,您选择了两个或多个维度来创建子立方体。

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

4) Pivot

在Pivot中,旋转数据轴来提供数据的替代表示。

在下面的示例中,主元基于项类型。

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

OLAP系统的类型

OLAP层次结构

《什么是OLAP(联机分析处理):多维数据集(Cube)是什么、怎么进行分析操作和OLAP系统类型有哪些》

OLAP类型 解释
关系型OLAP(ROLAP) ROLAP是一个扩展的RDBMS和多维数据映射,用于执行标准的关系操作。
多元化OLAP(MOLAP) 在多维数据中操作的模型。
混合在线分析处理(HOLAP) 在HOLAP中,聚合的总数存储在多维数据库中,而详细数据存储在关系数据库中。这既提供了ROLAP模型的数据效率,也提供了MOLAP模型的性能。
桌面OLAP(DOLAP) 在Desktop OLAP中,用户从本地数据库或桌面下载部分数据并进行分析。与其他OLAP系统相比,DOLAP的部署成本相对较低,因为它提供的功能很少。
Web (WOLAP) Web OLAP是通过Web浏览器访问的OLAP系统。WOLAP是一个三层架构。它由三个组件组成:客户机、中间件和数据库服务器。
移动OLAP 移动OLAP帮助用户使用移动设备访问和分析OLAP数据
Spatial OLAP SOLAP是为了方便管理地理信息系统(GIS)中的空间和非空间数据而创建的。

ROLAP

ROLAP处理关系数据库中的数据。事实表和维度表存储为关系表。它还允许对数据进行多维分析,是增长最快的OLAP。

ROLAP型号优点:

  • 数据效率高。它提供了很高的数据效率,因为查询性能和访问语言都经过了优化,尤其是针对多维数据分析。
  • 可伸缩性。这种OLAP系统为管理大量数据提供了可伸缩性,甚至在数据稳步增长的情况下也是如此。

ROLAP型号的缺点:

  • 对资源有更高的要求:ROLAP需要很大的人力资源、软件和硬件资源利用率。
  • 计算数据有局限性。ROLAP工具使用SQL计算所有聚合数据。但是,对于处理计算没有设置限制。
  • 查询性能缓慢:与MOLAP相比,该模型的查询性能较慢

MOLAP

MOLAP使用基于数组的多维存储引擎来显示数据的多维视图。基本上,他们使用OLAP立方体。

HOLAP

HOLAP是ROLAP和MOLAP的混合物。它提供了快速的MOLAP计算和更高的ROLAP可扩展性。HOLAP使用两个数据库。

  • 聚合或计算的数据存储在OLAP多维数据集中
  • 详细信息存储在关系数据库中。

HOLAP的优点:

  • 这种OLAP有助于节省磁盘空间,并且保持紧凑,这有助于避免与访问速度和方便性相关的问题。
  • HOLAP使用cube技术,可以为所有类型的数据提供更快的性能。
  • ROLAP是即时更新的,HOLAP用户可以访问这个实时即时更新的数据。MOLAP带来数据的清洗和转换,从而提高数据相关性。HOLAP很好的结合它们。

HOLAP的缺点:

  • 更高的复杂性:HOLAP系统的主要缺点是它同时支持ROLAP和MOLAP工具和应用程序。因此,这是非常复杂的。
  • 隐性重叠:重叠的可能性更高,尤其是在功能上。

OLAP的优点

  • OLAP是一个平台,适用于所有类型的业务,包括计划、预算、报告和分析。
  • 信息和计算在OLAP多维数据集中是一致的。这是一个至关重要的好处。
  • 快速创建和分析“what if”场景。
  • 轻松搜索OLAP数据库中的广泛或特定的术语。
  • OLAP为业务建模工具、数据挖掘工具和性能报告工具提供了构建块。
  • 允许用户通过各种维度、度量和过滤器对立方体数据进行切片和切割。
  • 它对分析时间序列很有帮助。
  • 使用OLAP很容易找到一些集群和异常值。
  • 它是一个功能强大的可视化在线分析过程系统,提供更快的响应时间。

OLAP的缺点

  • OLAP要求将数据组织成星型或雪花型模式。这些模式的实现和管理非常复杂。
  • 在一个OLAP多维数据集中不可能有大量的维度。
  • 事务数据不能通过OLAP系统访问。
  • OLAP多维数据集中的任何修改都需要该多维数据集的完整更新。这个过程需要花费大量的时间。

总结:

  • OLAP是一种允许分析人员从不同的角度提取和查看业务数据的技术。
  • OLAP的核心概念是OLAP多维数据集。
  • 各种业务应用程序和其他数据操作都需要使用OLAP Cube。
  • OLAP分析操作主要有五种类型:1) Roll-up 2) Drill-down 3) Slice 4) Dice and 5) Pivot
  • 三种广泛使用的OLAP系统是MOLAP、ROLAP和HOLAP。
  • 桌面OLAP、Web OLAP和移动OLAP是OLAP系统的一些其他类型。

文章说明:

本文翻译自国外技术文章:https://www.guru99.com/online-analytical-processing.html

本文为九五青年博客翻译,如需转载请在下面留言,原文如有版权问题,在下面留言板反馈,我们会第一时间处理

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注