`
coolwolf911
  • 浏览: 74952 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

数据仓库中的三种事实表

阅读更多

   在数据仓库领域有一个概念叫Transaction fact table,中文一般翻译为“事务事实表”。事务事实表是维度建模的数据仓库中三种基本类型事实表中的一种,另外两种分别是周期快照事实表和累积快照事实表。 

       事务事实表与周期快照事实表、累积快照事实表使用相同的一致性维度,但是它们在描述业务事实方面是有着非常大的差异的。 

       事务事实表记录的事务层面的事实,保存的是最原子的数据,也称“原子事实表”。事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。 

       事务事实表的日期维度记录的是事务发生的日期,它记录的事实是事务活动的内容。用户可以通过事务事实表对事务行为进行特别详细的分析。 

       通过事务事实表,还可以建立聚集事实表,为用户提供高性能的分析。

      2) 在数据仓库领域有一个概念叫Periodic snapshot fact table,中文一般翻译为“周期快照事实表”。
       周期快照事实表以具有规律性的、可预见的时间间隔来记录事实,时间间隔如每天、每月、每年等等。典型的例子如销售日快照表、库存日快照表等。

       周期快照事实表的粒度是每个时间段一条记录,通常比事务事实表的粒度要粗,是在事务事实表之上建立的聚集表。周期快照事实表的维度个数比事务事实表要少,但是记录的事实要比事务事实表多。

       周期快照事实表的日期维度通常是记录时间段的终止日,记录的事实是这个时间段内一些聚集事实值。事实表的数据一旦插入即不能更改,其更新方式为增量更新。

      3)在数据仓库领域有一个概念叫Accumulating snapshot fact table,中文一般翻译为“累积快照事实表”。
       累积快照事实表和周期快照事实表有些相似之处,它们存储的都是事务数据的快照信息。但是它们之间也有着很大的不同,周期快照事实表记录的确定的周期的数据,而累积快照事实表记录的不确定的周期的数据。 

        累积快照事实表代表的是完全覆盖一个事务或产品的生命周期的时间跨度,它通常具有多个日期字段,用来记录整个生命周期中的关键时间点。另外,它还会有一个用于指示最后更新日期的附加日期字段。由于事实表中许多日期在首次加载时是不知道的,所以必须使用代理关键字来处理未定义的日期,而且这类事实表在数据加载完后,是可以对它进行更新的,来补充随后知道的日期信息。
举例来说,
订货日期
预定交货日期
实际发货日期
实际交货日期
数量
金额
运费 

       在这个累积快照事实表中,记录的是购买货物的整个生命周期的数据,记录第一次产生时,实际发货日期和实际交货日期是不确定的,需要用表示未知的代理关键字来代替。等实际发货后,需要对数据仓库中的这条记录进行更新操作,将实际发货日期补上。

分享到:
评论

相关推荐

    数据仓库-维度、事实表模板

    目前,数据仓库一词尚没有一个统一的定义,著名的数据仓库专家W.H.Inmon在其 著作《Building the Data Warehouse》一书中给予如下描述:数据仓库(Data Warehouse) 是一个面向主题的(Subject Oriented)、集成的...

    数据仓库体系全套模板(命名+事实表+维度表+业务表+指标体系+整体设计)(6份).zip

    数据仓库体系全套模板,共6份,包括命名规范、事实表梳理、维度梳理、业务梳理及标体系梳理等。 模板-命名规范 模板-事实表梳理 模板-维度梳理 模板-业务梳理 模板-指标体系梳理 模板-数据仓库整体设计方案

    数据仓库文档模版数据仓库文档模版

    数据仓库文档模版数据仓库文档模版数据仓库文档模版数据仓库文档模版

    数据仓库使用手册

     数据仓库是多维数据库,它扩展了关系数据库模型,以星型架构为主要结构方式的,并在它的基础上,扩展出理论雪花形架构和数据星座等方式,但是不管是哪一种架构,维度表、事实表和事实表中的度量都是必不可少的组成...

    【推荐】数据仓库理论学习与实践资料合集(104份).zip

    数据仓库全套模板(命名+事实表+维度表+业务表+指标体系)(6份) 数据仓库设计建模(11份) 数据仓库原理、设计与应用课件(7章) 淘宝移动电信招商银行数据仓库实例(6份) Oracle数据仓库资料(7份) SQL_SERVER...

    数据仓库与数据挖掘技术

    第3章介绍数据仓库结构及其创建,包括数据仓库数据库、事实表、维度表及多维数据集创建;第4章介绍数据仓库开发完整过程,包括项目系统规划、用户需求确定、系统分析、系统设计、系统实现、系统试用及扩充;第5章...

    数据仓库-关于数据仓库维度数据处理的方法探究系列

    它们是事实数据表中用来描述数据的分类的有组织层次结构(级别)。这些分类和级别描述了一些相似的成员集合,用户将基于这些成员集合进行分析。(此概念引之于SQLServer2000联机帮助) 所有维度均直接或间接地基于表。...

    构建真正实用且可信的数据仓库

    元数据管理——如果人们不使用数据仓库的原因是因为复杂数据仓库环境加剧了沟通障碍而使合作遇阻,我们就必须着眼于必要的元数据管理实践,创建一种通用语言,使数据仓库更容易理解、更好使用并因此而更加可靠。

    数据仓库维度表更新技术分析

    发过程中,星型模式设计又是数据仓库设计的基本概念之一。 星型模式是由位于中央的事实表和环绕在四周的维度表 组成的,事实表中的每一行与每个维度表的多行建立关系, 查询结果是通过将一个或者多个维度表与事实表...

    基于大数据的数据仓库-数据仓库建模基本理论.pdf

    Ralph Kimball推崇数据集市的集合为数据仓库,同时也提出了对数据集市的维度建模,将数 据仓库中的表划分为事实表、维度表两种类型。 事实表: 在ER模型中抽象出了有实体、关系、属性三种类别,在现实世界中,每⼀个...

    关于数据库与数据仓库的区别详细介绍

    数据库是为捕获数据而设计,数据仓库是为分析数据而设计,它的两个基本的元素是维表和事实表。维是看问题的角度,比如时间,部门,维表放的就是这些东西的定义,事实表里放着要查询的数据,同时有维的ID。

    数据仓库ETL

    学习商业智能的基础资料,学习数据仓库ETL技术原理,ELT(数据抽取(Extract)、转换(Transform)、装载(Load)的过程.)

    北京中科信软数据仓库培训

    时间 内容 大纲 备注 第一天上午 数据仓库和商业决策的关系 描述当今商业领域BI和数据仓库的角色 描述为什么在线联机系统(OLTP)不能满足决策支持 决策支持系统的数据抽取流程... 讨论数据仓库中表和索引的分区方法

    数据仓库的概念及特点

    随着人们对大型数据系统研究、管理、维护等方面的深刻识认和不断完善,在总结、丰富、集中多行企业信息的经验之后,为数据仓库给出了更为精确的定义,即“数据仓库是在企业管理和决策中面向主题的、集成的、与时间...

    数据仓库体系

    数据仓库体系架构主要是介绍仓存系统的,比较容易了解仓储系统

    油田开发数据仓库的建立

    油田开发数据仓库面向油田开发指标分析、剩余油分布与潜力预测两个主题 , 通过采用多维建模技术创建了 4 个数据维表、8 个事实表、7 个外部表 , 实现了 10 个采油厂的数据加载。油田开发数据仓库的建立 , 为油田面向...

    数据仓库实例

    数据仓库入门,简单明了

    经典数据仓库(原书第三版)

    数据仓库经久不衰的教材,涵盖了数据仓库领域各个方面,并且一直跟踪最新的数据仓库技术和经典案例

    数据仓库实施过程需要考虑的七个步骤

    数据仓库并不涉及事务处理,并且在报表方面也仅占一小部分。而数据仓库应用程序的本 质是分析,尤其是针对业务智能的分析。BI并不是通常所说的数据:它是一种从旧有数据中,模型化得到的新的数据。那么如何才能从旧有...

    在SQL Server 2000数据仓库中使用分区

    矢量数据仓库围绕事实和矢量构建,从物理上通常表示为星形架构和雪花形架构,极少有同时包含事实和矢量的完全非正交化的平面表。由于矢量架构是最常见的关系型数据仓库结构,本文集中讨论这类架构的分区。

Global site tag (gtag.js) - Google Analytics