数据仓库ods层是啥意思_一文读懂大数据仓库建设

从传统数仓到大数据平台,MPP数据集市,Hadoop集群,还有混合架构数仓,一直在不断演进,但是万变不离其宗,大框架和方法论终归是那一套。所以本文就来分享数仓建设的方法论,文中针对的例子是大数据环境下的数据仓库建设,从目前互联网行业数据的采集,存储,同步以及任务调度与监控方面阐述了相关技术,还专门针对数据仓库的维度建模技术做了详细的介绍。88471c9a817fa8df81746c848ac58b43.png先从大数据数据仓库建设的整体架构说起。 下图是数据仓库的逻辑分层架构:

651a4fbf2bf59efeef260bb1640e6bd9.png

想看懂数据仓库的逻辑分层架构,必须先弄懂以下4大概念。 数据源 :数据来源,互联网公司的数据来源随着公司的规模扩张而呈递增趋势,同时自不同的业务源,比如埋点采集,客户上报,API等。 ODS层 :数据仓库源头系统的数据表通常会原封不动地存储一份,这称为ODS层, ODS层也经常会被称为准备区。这一层做的工作是贴源,而这些数据和源系统的数据是同构,一般对这些数据分为全量更新和增量更新࿰

版权声明:本文为weixin_30294759原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。