关于如何设计维度
收集想法。。。。。
假如事实表每天1000w条数据,数据仓库位雪花型。
假如某中间关系表内有200W条数据,由中间关系表衍生出去才是业务相关的维度表。
而且与中间关系表平行的有许多维度。
这时候是不是应该在数据过滤时就将中间关系表过滤掉,不然使用引用的维度关系效率太低了,当然前提是这个中间表不涉及到业务中去。
------解决方案--------------------
数据量太大的情况下,尽量用星形吧,非得用雪花型就得修改聚合方式
对Cube架构而言,聚合的时候尽量根据需求,不要弄太多的扩展需求,减少cube生成时间