什么是数据暂存?
在数据仓库过程中,数据暂存区收集数据暂存服务器软件和提取、转换和加载活动结果的数据存储归档(存储库)。
数据暂存软件服务器临时保存和更改从 OLTP 数据源提取的数据,存档存储库存储清理、转换的数据和属性,以加载到数据集市和数据仓库中。
数据暂存流程将信息作为流或文件导入、更改、生成集成的、清理过的数据,并将其暂存以加载到数据仓库、数据集市或操作数据存储中。
数据暂存工具是可访问的,并且数据在数据库中。数据流开始时出现在源系统之外,通过转换引擎进行更改,并进入临时数据库。
在第二种方法中,它可以从大型机遗留系统开始,然后将受欢迎的记录提取到平面文件中,将文件更改为登台服务器,转换其内容,并将转换后的信息加载到登台数据库中。
数据仓库暂存区是一个临时区域,用于复制来自源系统的数据。出于计时原因,数据仓库架构中通常需要一个暂存区。简而言之,在将数据统一到数据仓库之前,所有必需的信息都应该可用。
由于业务周期、数据处理周期、硬件和网络资源限制以及地理因素的不同,无法同时准确地从所有 Operational 数据库中提取所有信息。
示例- 每天提取销售数据可能是合理的,但是,每日提取不适用于需要月末对帐程序的财务信息。同样,在东部标准时间中午从新加坡的数据库中提取“客户”数据可能适合,但这不适用于芝加哥数据库中的“客户”数据。
数据仓库中的数据可以是持久的(即长时间保留)或暂时的(即仅暂时保留)。并非所有企业都需要数据仓库暂存区。对于很多企业来说,使用ETL直接将数据从运营数据库复制到数据仓库是比较合适的。
数据暂存的优缺点
好处
分级过程与转换过程并行控制。
磁盘 I/O 减少了一半,因为临时表只被写入,反对写入,然后再次提取。
缺点
如果转化过程下降,那么分期过程也将停止。
以上是 什么是数据暂存? 的全部内容, 来源链接: utcz.com/z/359530.html