希嘉认为面对数字时代的海量数据和智能化、自主可控的需求,数据仓库作为数据“落地”的业务场景,是实现决策支持的关键技术环节。
在说数据仓库之前,先给大家简单讲讲数据价值在哪?数据之所以存在价值,就是想数据作为生产要素体现资产价值,这需要对日常业务记录的各类数据信息进行聚合分析,通过形而上学哲学思维,透过现象找到业务本质的规律、问题。从而更加有针对性、精准性调整政策策略,实现业务精进优化。那么如何能让我们高效、迅速、准确的找到我们想要的数据,并快速实现聚合分析呢?基于这个目的,数据仓库概念应运而生。数据仓库既可以存储积累海量的业务数据,又可以通过合理数据分层架构和优异计算查询性能,从而实现高效、迅速、准确的数据聚合分析。
那么数仓分层又是什么呢?概念上是传统管理学中分层次管理。举个例子,项目、事情、生产商品都需要把一个整体拆分成几个步骤分步来实现,数据分析也是同样的道理。数据在这个过程中会有不同的形态和存储结构,从中找到几个关键形态和结构切分步骤就成了数据仓库分层雏形。正如工厂产品,有分层的模块化生产能快速大量生产一样,数据仓库有分层存储管理也可以同样实现高效、迅速、准确的数据应用产品生产。
希嘉基于数据仓库分层概念,推出具备6大特性数据仓库产品:
数据结构清晰化:每一个数据分层都有它的作用域,在使用表的时候能更方便地定位和理解。
数据关系条理化:源系统间存在复杂数据关系,当同时存在多个系统时,如何取数决策成为关键。对相同主题的数据进行统一建模,把复杂的数据关系梳理成条理清晰的数据模型,避免上述问题。
数据血缘白盒化:简单理解就是我们最终给业务呈现的是能直接使用的业务表,但是它的来源有很多,如果有一张来源表出问题,我们能够快速准确地定位到问题,清楚它的危害范围,并加以改正。
数据复用最大化:以规范数据的分层,满足不同使用场景和数据粒度需求,极大减少重复计算。通过汇总层的引入,避免了下游逻辑的重复计算,节省了开发时间和精力,减少了不必要的数据冗余,实现计算结果复用,存储和计算成本降低。
数据处理简单化:将复杂任务分解成多个步骤来完成,每层只处理单一步骤,保障数据的准确性,在数据出现问题后,也只需从有问题的步骤开始修复。对于使用者而言,将数据按照层次结构组织可以优化查询路径,减少数据扫描和查询时间,提高查询性能。
业务影响最小化:当源业务系统的业务规则发生变化时,只需调整相应层次的数据处理逻辑,而无需对整个数据仓库进行重构,降低维护成本,提高数据稳定性和连续性,加强数据仓库的可扩展性。
数智化时代,数据仓库作为最核心、挑战最大的技术环节之一,希嘉坚持“前瞻性架构布局、以客户场景为驱动”,在架构设计上,采用存-算-管分离架构,帮助客户更好撬动数据潜能,最大化数据价值;在数据服务上,实现与应用场景的深度融合,实现智能预测、智能决策等数据分析智能化。