更改数据捕获 (CDC) 被广泛定义为跟踪数据库中的更改。跟踪变化的目的是多种多样的。嵌入式数据库系统中的 CDC 可以通过几种不同的方式实现,这些方式有时对应用程序是不可见的,应用程序可以利用这些方式进行数据共享、响应事件和增量备份。
第一个,可能也是最明显的,在嵌入式数据库中实现 CDC 是实现事务的 ACID 属性的一部分:原子性、一致性、隔离性和持久性。将事务成功应用到数据库会将该数据库从一种一致状态转移到新的一致状态。相反,事务对数据库的不成功应用必须使数据库返回到事务应用不成功之前存在的一致状态。为了满足这些要求,数据库管理系统必须跟踪变化。实现细节因数据库系统而异,甚至在数据库系统系列中,从纯内存数据库、持久内存数据库、
在纯内存数据库的情况下,没有用于记录更改的事务日志。因此,在事务处于活动状态时,需要将更改或更改记录的前映像保存在缓冲区中,以便数据库可以在事务中止时恢复到其事务前状态。
对于具有持久性的内存数据库,所有更改也附加到存储在持久媒体上的事务日志中,可以在崩溃后重播以进行恢复。
对于持久性(基于磁盘的)数据库,还使用事务日志记录,以优化性能并支持从崩溃中恢复。在这种情况下,可以提供两种形式的事务日志记录:UNDO 日志记录和预写日志记录 (WAL)。WAL 如上一段所述。UNDO 日志将更改记录的前映像写入事务日志文件。在发生崩溃时,UNDO 日志信息用于回滚不完整的事务(即,将数据库返回到最后一致的状态)。
在某些数据库系统中,CDC 的另一个内部使用是通过 MVCC(多版本并发控制)实现乐观并发控制。乐观并发控制意味着应用程序不必获取锁,这也意味着应用程序永远不必等待另一个应用程序持有的锁。这要求数据库系统知道两个应用程序是否试图同时修改同一个数据库对象。这是通过跟踪提交事务时检查的版本号来完成的(因此名称,多版本并发控制)。如果对象的版本在应用程序获取对象副本的时间和应用程序想要对该对象提交更改的时间之间发生了变化,则意味着另一个应用程序首先修改了底层对象,并且必须中止并重试该事务。 MVCC 背后的理论是,这种冲突很少见,偶尔重试比总是必须获取锁并可能用这些锁阻塞其他应用程序更有效。
CDC 还用于需要“五个 9”可用性(即 99.999% 正常运行时间)的系统的高可用性 (HA) 实施。HA由不同的数据库供应商以不同的方式实现:实时事务复制,SQL语句复制,日志文件转发等。有所谓的1-safe(又名lazy,异步)和2-safe(又名渴望,同步) ) 实现。例如,实时事务复制可以是 1-safe 或 2-safe(在e X treme DB 中,我们将其称为时间认知两阶段提交);日志转发本质上是 1 安全的。
CDC 可以在嵌入式数据库和/或第三方系统中用于可在应用程序中使用的其他目的:开放复制、触发器/事件通知和增量备份。
一些嵌入式数据库系统实施复制以例如支持高可用性和/或数据库集群。这样的系统可以很容易地在同一数据库系统的两个或多个实例之间复制数据或事务,但是当需要从嵌入式数据库复制到任何其他目标时,它们不是解决方案。有第三方产品试图填补这一空白,例如 Actian DataConnect 和 Oracle Golden Gate。或者通过自定义提取-转换-加载 (ETL) 解决方案,该解决方案可能对源和/或目标数据库中的更改敏感。
触发器和事件通知方案是变更数据捕获的经典用例。毕竟,触发器是在指定表的 INSERT、UPDATE 或 DELETE 语句执行时触发的。换句话说,数据发生了变化,触发器捕获了该变化,周围系统以某种方式对其进行操作。
嵌入式数据库系统中变更数据捕获的最后一个重要目的是实现增量备份设施。必要时,增量备份方案必须知道在上次完整快照或上次增量备份之间数据库中发生的增量更改。
结论
变更数据捕获是任何数据库管理系统的核心。它有助于实施并发性和持久性、复制、触发器/事件通知以及备份和恢复的 ACID 属性。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !