一、维度的类型(相互之间有特性重叠):
1)常规维:基础的维度,如:城市维度、日期维度、时间维度;
2)共享维:用于多个事实表的维;
3)私有维:用于单一事实表的维;
4)代理维:也有叫法为虚拟维,主要根据事实表的属性自定义映射的值;
5)退化维:仅仅是事实表中的一列,这个维的相关信息都在这一列中,没有维表与之相关联;
6)渐变维:维度属性随时间发生变化的。
二、具体建立维度需要注意的几个地方
1、日期/时间维度
对于用户入网、业务办理、用户话务量等的分析中,都需要考虑日期/时间维度。 几乎所有的事实表中都要考虑到日期维度,在日期维度中需要建立特殊日期的维护。对于忙闲时的分析需要按照小时的时间维度。
2、既是事实表,也是维度表。
在业务建模中,对于用户入网资料表,对于用户入网分析中,此表作为fact table;但对于做用户的话务量分析,此表作为dimension table。此表承担了两种role。
3、会设计到星系模式,网系模式的建模。
对于承担了事实表和维度表两种角色一般都会是网系模式,以及共享维度的事实。
4、fact table需要考虑不同类型的处理
需要考虑事务型事实表、累积型事实表、周期型事实表的正确选择。
对于需要按截止日期的用户资料事实表,采用周期快照型事实表。有周期快照型的事实表同时承担了维度表的角色,需要采用手段防止作为维度表的数据量扩张。
可以采用的手段主要有:
1)周期快照的分区处理;
2)建立不同分区的物化视图作为维度;
3)按照周期建表独立管理,如:subscriber200610,subscriber200611,subscriber200612,但是这样管理难度没有分区表容易。
对于话务量、业务量办理的事实表,采用累积快照事实表,这部分的数据量膨胀会相对比较大。需要控制好表分区的设计。
5、由事实表维护维度表存在维度表中的记录需要通过事实表来确定。
在竞争对手的分析中,作为本方不清楚对方的新号段,对于后台需要自动提取对方的新增号段更新到维度表中。

1 条评论:
正在关注ing.....
发表评论