数据仓库为什么有意引入冗余?采用反范式来设计?
数据仓库为什么有意引入冗余?采用反范式来设计?
------解决方案--------------------数据冗余并不一定是坏事,数据仓库更多是用来分析数据的,多处重复数据很正常啊
------解决方案--------------------因为冗余往往可以提高读取的速度,有一点点像用空间换时间,而现在空间的成本不大。而且纯理论会对现实世界的很多实际操作带来阻碍。其实不管是数据仓库还是数据库。都是比较适合的。
------解决方案--------------------全是关系关联.你必须关联很多的表才能得到一个结果.
如果冗余肯定少关联一些表.
这只是简单的一面
------解决方案--------------------空间换时间
------解决方案--------------------
1、减少关联的开销
2、减少汇总的开销
------解决方案--------------------
+1
------解决方案--------------------由于数据仓库存储的是海量数据,所以对于查询统计时间的敏感性比空间要高,所以采用冗余设计是为了尽可能的提高海量数据的检索速度,这时候空间已经不是瓶颈问题了。
------解决方案--------------------别被BI迷惑,了解企业分析数据的方法、工具从而解决需求,bi就是这么回事
------解决方案--------------------
业务整合技术,前途大大滴好啊