数据仓库术语
所属分类 DW
浏览量 1440
Data Lake
可以存放海量原始数据的数据湖,和传统的数据仓库对应
数据仓库中的数据是经过加工的结构化数据,往往是分类的,可以使用传统数据库存储
数据湖存储非加工数据,比如日志、视频等,并且不分类
BI/Analytic Database
为商业智能和分析而优化的数据处理技术。包括数据清理,ETL,数据挖掘等。生产报表,也支持adhoc查询,数据反范式设计。
Enterprise Data Warehouse(EDW)
作为企业唯一的数据仓库,EDW提供统一的数据服务,查询结果有效一致。数据设计支持跨部门,支持海量数据,并支持大量的查询请求。
Data Mart
专注于部门级别而不是公司级别的统一数据服务。
Operational Data Store(ODS)
介于数据仓库和业务数据库之间的系统。
业务系统没有海量历史数据,数据仓库有但数据只读。
ODS保存来自业务系统的海量数据,并且需要频繁的增删改查,往往用来支持对近期数据的OLTP查询,以减轻业务系统负载。
OLAP Online Analytical Processing
OLTP On-Line Transaction Processing
OLAP ROLAP MOLAP HOLAP
ROLAP Relational OLAP
MOLAP Multidimensional OLAP
HOLAP Hybrid OLAP
OLAP的基本多维分析操作
钻取(roll up和drill down)
切片(slice)和切块(dice)
旋转(pivot)
ETL data extract, transform and load
事实 维度 粒度 度量值
主题 维度 维度层次
粒度是与具体指标相关的,具体表现在描述此指标的某些可分层次维的维值上。
例如,时间维度,可以分成年、季、月、周、日等。
超立方结构(Hypercube)指用三维或更多的维数来描述一个对象
星型模型
雪花模型
当星型模型的维度需要进行规范化时,演进为雪花模型
元数据
OLAP术语
OLAP ROLAP MOLAP HOLAP
上一篇
下一篇
java内部类
java泛型
Linux Load 查看及计算
spring-session-jdbc使用数据库存储共享session
shell里的浮点数运算
linux shell 获取进程相关信息