数据仓库维度建模需避免的常见错误
云开_sky 推酷

按重要性由大到小列举常见的错误:

10: 在事实表中放置用于约束与分组操作的文字型属性。(不可避免时可设计到维度表中。)

9: 在维度表中试图为了节省空间而限制使用详细的描述属性。(维度属性越详细越好。)

8: 将体系与体系层次分解成多个维度。(重度雪花模型设计者,坏处是会增加事实表与维度表关联的复杂性,影响查询效率,多体系多层级维度是可做单一维度设计的。)

7: 忽视跟踪维度变化的需要。(不考虑缓慢变化维的处理,可通过代理键来解决。)

6: 通过增加更多的硬件来解决所有的查询性能问题。(优先考虑是否进行了软件层级的性能优化,包括不限于:正确合理的索引、分区分表甚至分库、集合运算、并行计算、分布式计算、数据聚合、业务逻辑拆分等。)

5: 使用操作性或者智能关键字将维度表连接到事实表上。(排斥、不使用代理键。)

4: 忽视事实表粒度的定义与使用。(糅合各种粒度的数据到事实表中。)

3: 基于具体的报表来设计维度模型。(一般为了满足业务需要快速出报表,出现这种情况。但是还是得慢慢沉淀,不断迭代,演进出通用的维度模型。)

2: 希望用户以规范化的格式查询最底层的原子型数据。(这个活还是留给业务系统来干吧^_^)

1: 舍弃在单独的事实表之间保持事实与维度的一致。(尽量达到不同事实表之间维度的高度一致,这是仓库总线结构的基础。)


CIO之家 www.ciozj.com 公众号:imciow
关联的文档
也许您喜欢