The Data Warehouse ETL Toolkit学习笔记-架构(数据流主线―数据访问)
ETL系统的最终目的就是为了在展示层中提供维度模型,便于查询工具、报表工具、仪表盘和OLAP立方体的访问。
前台的数据就是最终用户实际看到的数据。
(一)数据集市
数据集市是前台一个重要的组成部分。它是为支撑某个业务流程而建立的维表集合。
1、数据集市基于数据来源,而非部门的视图。
2、数据集市包含全部的原子级粒度数据,支持向下钻取到最低的数据级别。
数据集市只包含聚合数据的观点是数据仓库设计人员最容易犯下的错误之一。
3、数据集市即可以集中管理也可以分布式管理。
注意:
Inmon在Building The Data Warehouse一书中将数据集市定义为面向部门应用的数据库,所有部门的数据源都是数据仓库,部门层常被称为“数据集市层”、OLAP层或“多维DBMS”层。
Building The Data Warehouse一书与上述观点有以下几个不同点: