当前位置: 首页 / 搜索关键词:数仓
本文为大家提供一种高效的实时数仓架构:基于亚马逊云科技 Serverless 架构的实时数仓架构。
2022/09/03
本文为大家提供一种高效的实时数仓架构:基于亚马逊云科技 Serverless 架构的实时数仓架构。
2022/09/03
绝大数公司建立数仓之初是没有考虑好数据治理怎么做的,因为数据部门刚开始成立,必然要有一些“数据驱动”的成果,而数据治理不能很好的体现这些业绩。所以,都是在业务发展的过程中,逐渐遇到了一些数据问题,才考虑做这件事的。
自我接触数仓以来,数仓建模就是最为核心的工作,而数仓建模的主要目的是建立公共层,公共层主要起到两个作用,第一个是屏蔽底层的变动对上层应用的影响,第二个作用是通过复用沉淀的公共层来提升应用支撑的效率,但在长期的数仓公共层运营实践中中,我发现公共层的表现不总是沿着我们设想的轨迹演进。
当前,数据仓库被分为离线数仓和实时数仓,离线数仓一般是传统的T+1型数据ETL方案,而实时数仓一般是分钟级甚至是秒级ETL方案。并且,离线数仓和实时数仓的底层架构也不一样,离线数仓一般采用传统大数据架构模式搭建,而实时数仓则采用Lambda、Kappa等架构搭建。
自我接触数仓以来,数仓建模就是最为核心的工作,而数仓建模的主要目的是建立公共层,公共层主要起到两个作用,第一个是屏蔽底层的变动对上层应用的影响,第二个作用是通过复用沉淀的公共层来提升应用支撑的效率,但在长期的数仓公共层运营实践中中,我发现公共层的表现不总是沿着我们设想的轨迹演进。
在本文中,我们将会介绍数据实时入仓所面临的挑战,以及Hologres为了应对这些挑战在技术原理上的创新和演进,支撑实时数仓的高吞吐实时写入与更新,加速业务数据探索。
资讯推荐
热门最新
精品工具
你可能感兴趣的资讯
换一批