什么是数据备份?就是把数据再次备份一下。感觉是废话?大道本来就很简单。
举一个照片的例子,你用手机拍了一张照片,存储在手机硬盘里面。
现在讨论怎样保证这张照片永远都存在。(仔细想想,这不可能,矛盾论中说事物永远都在运动,照片不可能永远都存在!!)因此我们只能讨论这张照片在一个具体的时间内都存在。
保存7天。
就7天,让它安静地躺在手机里面,每天去看一眼,最佳方案。
保存1年。
拷贝到电脑里、上传云盘、微信传输……方式很多,每个月去看一眼。
保存100年。
哈哈,这里就是做项目的难处了。明明经费就不够,甲方还要你保障数据完全安全。想想保存100年就不靠谱,但是未来也许真的可以保存上万年。举这个例子,想必大家了解了数据备份的基本需求和手段。现在我们来讨论真实环境下的数据备份方案。
01
备份策略
全量备份:备份目标下所有的有效数据。
差异备份:每次都备份自上一次全量备份之后新增加的和修改过的数据。
增量备份:每次仅备份自上一次备份后增加的和修改过的数据,上次的备份可以是全量备份、增量备份或差异备份。
建议全量备份和差异备份组合应用。
举个栗子:以每周数据备份计划为例,我们可以在星期日进行全量备份,在星期一至星期六进行差异备份。如果在星期六数据被破坏了,则只需要还原星期日的全量备份和星期五的差异备份。这种策略备份数据需要较多的时间,但还原数据使用较少的时间。
02
备份的系统架构 备份系统架构的流程可以简单这么理解:
控制流:备份管理服务器发送指令给备份客户端。
数据流:数据从生产存储→SAN(Storage Area Network 存储区域网络)→数据库服务器→SAN→备份介质服务器→SAN→备份介质。
03
备份的机制 从实战入手,学习一下备份的几种机制:
基于LAN进行数据传输的LAN-Base机制。
基于SAN进行数据传输的LAN-Free机制。
基于SAN进行数据传输的Server-Free机制。
01
LAN-Base
优点:数据流和控制流都走的LAN网络,备份系统和应用系统分开,备份时不占用生产服务器的资源。
缺点:占用较大的LAN网络带宽,对主机应用有一定影响。
02
LAN-Free
优点:控制流通过LAN传输,数据流通过SAN网络传输,大大提高备份性能且不影响用户网络,释放了对LAN网络带宽的占用。
缺点:对生产服务器的压力比较大。
03
Server-Free
优点:控制流通过LAN网络传输,数据流通过介质服务器在SAN网络进行传输。
备份的时候,先创建该时间点下生产数据的快照并将其映射给备份管理服务器,然后由备份管理服务器将该快照挂载起来,最后将快照数据拷贝至备份介质。
生产服务器不再安装相应的代理软件,将备份客户端安装在介质服务器上来获取生产服务器上要备份的数据,减少生产服务器的压力。
缺点:成本较高,对备份管理服务器、介质服务器设备的要求较高。
当然,一个完美的备份,需要三个要素的完美配合,那就是:备份三要素。
BW(Backup window,备份窗口):一个工作周期内留给备份系统进行备份的时间长度。
RTO(Recovery Time Objective,恢复时间目标):主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务恢复服务所需要的最短时间周期。
RPO(Recovery Point Objective,数据恢复点目标):指发生故障后允许丢失的数据量。
如果一个备份方案可以达到RTO=0,RPO=0,就是备份的完美状态。
04
实际应用中的数据备份方案 随着金融,银行,政府等越来越多的用户要求核心业务7*24不断网、不断电持续运行,进而出现了两地三中心和双活或多活的方案。两地三中心和双活或多活对于很多人可能很陌生,我们拆开介绍:
在两地三中心架构中,同城的两个数据中心之间通过高速网络进行数据同步,实现了主备切换和故障恢复。当主数据中心发生故障时,备份数据中心会自动接管服务,保证系统的连续性和可用性。
同时,异地数据中心作为备份,可以在主备数据中心都出现故障时提供服务。
两地三中心架构是一种分布式系统的架构模式,用于保证系统的高可用性和容错性。它将整个系统划分为三个数据中心:两个位于同城,一个位于异地。其中,同城的两个数据中心分别承担主备的角色,异地数据中心则作为备份。这样解释是不是还是有点困惑,继续拆开解释:
两地三中心:是指同城双中心+异地灾备一种商用容灾备份解决方案。
两地:是指同城、异地。
三中心:是指生产中心、同城容灾中心、异地容灾中心。
双活或多活 :是一种分布式系统架构,它允许两个或多个数据中心同时处理用户请求,并且这些数据中心之间可以相互协作,实现数据的共享和同步。
结语
为了实现高效的数据备份,通常需要对备份数据进行格式转换和压缩等操作,这一过程一般由专业备份软件完成。与普通文件备份不同,数据库备份涉及应用插件与数据库的协调,以确保备份数据的一致性和完整性。这项技术也因其含金量颇高而备受重视。
数据备份涉及备份服务器、备份软件、数据服务器和备份介质四个关键组成部分。备份服务器执行备份操作,备份软件按照预先制定的备份策略将数据备份到磁带或磁盘等存储介质上,而数据服务器则承载重要数据。备份介质,如磁带或磁盘,则是数据备份的存储媒介。
虽然数据备份涉及多种术语和策略方案,如LAN-Base、LAN-Free、RTO、RPO、两地三中心、双活或多活等,但在处理这些复杂名词时,我们的重点是关注主要数据。问问自己的数据究竟在哪儿,什么数据丢失,我顶不住,抓住关键问题,解决它,剩余的问题,下次再说!
审核编辑:刘清
全部0条评论
快来发表一下你的评论吧 !