初学数据仓库
创建日期:2003-12-26
修正日期:2003-12-29
[摘要 ] 本文是阅读《决策支持与数据仓库系统》一书的学习体会.
[关键字] 数据仓库、决策支持
书中有一段非常深刻的话,摘录如下:“当读者开始本人的职业生涯时,要记住技术是服务于组织需求的工具。如果不服务于组织的需求,技术将毫无价值。我们必须首先考虑组织的需求,在业务中学习技术是重要的,仅仅在以下的意义下才可协助组织机构获得满足其需求的信息系统。只要当我们理解组织的需求时,才该当考虑满足组织需求的技术。反之,如果先考虑技术后考虑组织的需求,则将只能产生一座令人印象深刻的但却毫无用途的技术留念碑。“
顾名思义,数据仓库是一个存放货物或材料的地方,数据仓库的作用是辅助决策,也就是决策支持系统的一种。对于一个企业的决策者来说,并非所有的信息都是关键的,决策数据也并不需求来自厚厚的报告。较小的数据集合称作数据集市
FAQ<书中的一些基本概念,对快速理解数据仓库有协助>
n EIS和ESS的区别是什么?他们之间有什么共同点?
1.EIS: 高级管理人员信息系统
2.ESS:高级管理人员支持系统,在EIS的基础上添加了一些附加功用,如连接电子邮件系统或办公日程安排表,还可能包括建模及专家系统的功用。
n 数据仓库具有三个特征:
1.包含大量数据
2.组织数据仓库是为了愈加便利地使用数据进行决策
3.为最终用户提供了可用来存取数据的工具
n 两个基本硬件的进步使得数据仓库实用
1.需求大量的存储器(价格低廉而且容量高)
2.需求大量的计算机资源(硬件的快速发展)
n 什么为数据仓库提供输入信息?什么从数据仓库获取信息?
答:操作数据库为数据仓库提供输入,用户从数据仓库中获取信息
n 在数据装载进数据仓库之前对数据必须做的三件事是什么?
答:预备、组织和呈现
n 高级管理人员使用的信息系统有什么特点?
1.跨部门
2.面向数据
3.本质上的汇总性质
4.面向图形
5.基于通信
6.为高级管理人员团体偏好精心定制
n 什么是数据立方?
与组织数据仓库数据库的多维十分类似
n 什么是系统?什么是系统的关键性?
系统是具有目标的,由一组互相作用的组成部分构成,关键词是:组、互相作用、组成部分、目标
n 信息系统与普通系统有何区别?
信息系统的目的是存储、处理和交换信息
n 数据流图表示什么?数据流图不表示什么?
数据流图以处理和数据存储之间的数据流方式表明组成部分之间的互相作用。数据流图并不是对系统的完整描述,数据流图不能表示系统目标,但通常可从其他信息源推断系统的目标,数据流图也不能表示系统中各处理之间的时间关系.
n 决策支持系统与普通信息系统有何不同
决策系统是一种特殊的信息系统。使用不止一个数据存储(数据库或文件集合)以便提供支持决策的信息。决策支持系统不更新作为其外部信息源的数据库。决策支持系统与决策者交换信息
n 为什么决策支持系统使用模型?
如果劳模功用为决策者提供显示世界的观察所能提供的相反信息,并且同时提供胜过理想世界观察的优点,该模型就将成为有用的工具。
n 模型的次要品种是什么?
图形模型、叙说型模型、物理模型
n 为什么在商业中通常不使用连续性模型?
连续系统模仿模型描述了物理或经济过程,在其中描述系统的数字时辰在变化。简单的连续系统可通过积分和微分方程来研讨。
商业系统通常由系统中惹起连续变化的可分辨的时间来刻画:定单到达、产品的发货。从商业计划观点来说,这些霎时阶段是无关的。将这些霎时阶段结构到模型中添加了模型的复杂性却未能添加其用途。因此,商业模仿通常不用连续模型。
n 什么是伪随机数?为什么在模仿模型中伪随机数十分有用?伪随机数是如何得到的?
由一个可反复的公式产生的数,这些数在统计意义上仿佛是真的随机数。所有的模仿软件包和大多数的编程言语均有可在一个很有用的范围上前往均匀分布的伪随机数的内置的函数。