星形模型(Star Schema)和雪花模型(Snowflake Schema)是数据仓库中常用到的两种方式,而它们之间的对比要从四个角度来进行讨论。
1.数据优化
雪花模型使用的是规范化数据,也就是说数据在数据库内部是组织好的,以便消除冗余,因此它能够有效地减少数据量。通过引用完整性,其业务层级和维度都将存储在数据模型之中。
▲图1 雪花模型
相比较而言,星形模型实用的是反规范化数据。在星形模型中,维度直接指的是事实表,业务层级不会通过维度之间的参照完整性来部署。
▲图2 星形模型
2.业务模型
主键是一个单独的唯一键(数据属性),为特殊数据所选择。在上面的例子中,Advertiser_ID就将是一个主键。外键(参考属性)仅仅是一个表中
的字段,用来匹配其他维度表中的主键。在我们所引用的例子中,Advertiser_ID将是Account_dimension的一个外键。
在雪花模型中,数据模型的业务层级是由一个不同维度表主键-外键的关系来代表的。而在星形模型中,所有必要的维度表在事实表中都只拥有外键。
3.性能
第三个区别在于性能的不同。雪花模型在维度表、事实表之间的连接很多,因此性能方面会比较低。举个例子,如果你想要知道Advertiser
的详细信息,雪花模型就会请求许多信息,比如Advertiser Name、ID以及那些广告主和客户表的地址需要连接起来,然后再与事实表连接。
而星形模型的连接就少的多,在这个模型中,如果你需要上述信息,你只要将Advertiser的维度表和事实表连接即可。
4.ETL
雪花模型加载数据集市,因此ETL操作在设计上更加复杂,而且由于附属模型的限制,不能并行化。
星形模型加载维度表,不需要再维度之间添加附属模型,因此ETL就相对简单,而且可以实现高度的并行化。
总结
雪花模型使得维度分析更加容易,比如“针对特定的广告主,有哪些客户或者公司是在线的?”星形模型用来做指标分析更适合,比如“给定的一个客户他们的收入是多少?”
原文链接:http://www.searchbi.com.cn/showcontent.aspx?aid=64436
分享到:
相关推荐
数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS雪花模型.docx数据仓库架构星型模型VS...
数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型.pdf数据仓库架构星型模型VS雪花模型...
星型模式、雪花模型多维数据建模分析,包含不同的数据建模方法
基于⼤数据的数据仓库-数据仓库建模基本理论 (内容整理⾃⽹络学习视频) ⼀、数仓建模的⽬标 访问性能:能够快速查询所需的数据,减少数据I/O。 数据成本:减少不必要的数据冗余,实现计算结果数据复⽤,降低⼤数据...
数据仓库是多维数据库,它扩展了关系数据库模型,以星型架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但是不管是哪一种架构,维度表、事实表和事实表中的度量都是必不可少的组成...
星型模型 AND 雪花模型 ...模型都为雪花模型,实际数据仓库中两 种模型会并存。 中间层将雪花转变成星型 星型模型相对结构简单,在数据中间层 利用数据冗余将雪花转变成星型模型有 利于数据应用和减少计算资源消耗。
星级酒店数据集市雪花模型的设计与应用.docx
大班语言教案:假如我是一片雪花.docx
幼儿园教案2021-大班语言:假如我是一片雪花.doc
定义数据仓库的商业和逻辑模型 讨论企业级的策略分析工作 定义商业模型的各个部分 讨论数据仓库中元数据所扮演的角色,及追踪元数据的方法 定义逻辑模型和实体关系模型 第二天下午 创建维模型 详细介绍星型模型 ...
使用koch分形技术模拟的雪花模型 简单易懂 主要使用嵌套完成
矢量数据仓库围绕事实和矢量构建,从物理上通常表示为星形架构和雪花形架构,极少有同时包含事实和矢量的完全非正交化的平面表。由于矢量架构是最常见的关系型数据仓库结构,本文集中讨论这类架构的分区。
模型构架 尽量使用星型架构,使用雪花架构的目的是使事实表第一级的维表数量达到最小。
提出了低保基础信息数据集市的数据模型———雪花模型 ,并对数据模型中的事实表、维度表、大维度、粒度、聚集事实表等相关的技术问题进行了细致的探讨 ,对研究并建立低保基础信息数据集市具有参考价值和实际意义。
绪论 2 1.1项目背景 2 1.2 提出问题 2 2 数据库仓库与数据集的概念介绍 2 2.1数据仓库 2 2.2数据集 2 3 数据仓库 3 3.1 数据仓库的设计 3 3.1.1数据仓库的概念模型设计 3 3.1.2数据仓库的逻辑模型设计 3 3.2 数据...
数据仓库和商业决策的关系 描述当今商业领域BI和数据仓库的角色 描述为什么在线联机系统(OLTP)不能满足决策支持 决策支持系统的数据抽取流程所带来的数据仓库技术 使用数据仓库技术的原因 如何使用数据仓库来...
Olap模型设计指南 详细介绍实战技巧 维度建模 星型雪花架构
雪花积木模型
雪花:Elixir中的分布式雪花生成器