读数据维护:作业负载的可恢复性04备份与档案
1. 差异备份与档案
1.1. 两个彻底不同的操作
-
1.1.1. 要完成的是两个彻底不同的方针
-
1.1.2. 备份(backup)
-
1.1.3. 档案(archive)
1.2. 有些产品既能制造备份,又能制造档案
1.3. 某些产品或服务分明是专门用来制造备份的,但有人却偏偏想趁便用它来制造档案
- 1.3.1. 分明是在做其间的一项操作,却偏偏把它叫成另一个姓名,那就不太对了
1.4. 把制造备份的软件当成制造档案的软件来运用,不只会增加本钱,还会让安排面对更大的危险
1.5. 不要总以为把备份数据保存许多年是一个很了不得的规划思路,除非你能保证这个备份体系能够顺畅地将多年曾经的备份获取到,并且能够很好地从中康复数据
1.6. 不要把那种带有档案制造功用的SaaS式产品误认为备份产品,由于那些产品制造出来的是档案,而不是真实的备份
1.7. 档案是为了便于你从中查找并获取信息,而不是让你用它们来康复数据的
1.8. 备份与档案是数据维护作业的最终防地
2. 什么是备份
2.1. backup实际上便是该文件的一份copy(副本),这份copy一般就放在原文件的周围
-
2.1.1. 仅仅一个copy,而不是真实的备份
-
2.1.2. 做法违反了3-2-1准则
2.2. virtual snapshot(虚拟快照)
-
2.2.1. 一种虚拟的copy,有必要依靠原文件才干体现出它的含义
-
2.2.2. 不是真实的备份
-
2.2.3. convenience copy(快捷仿制或便利仿制),
-
2.2.4. 对文件体系或存储体系所做的virtual snapshot(虚拟快照)不是copy,由于它们并不包含原数据里的内容
-
2.2.4.1. 仅仅在许多当地引用了原数据罢了
-
2.2.5. NAS的快照、XFS的快照、Windows的VSS(Volume Shadow Copy Service,卷影仿制服务)快照,以及VMware或Hyper-V这样的虚拟机管理程序所做的快照,都归于virtual snapshot,它们自身并不能算作copy
2.3. 备份是对数据所做的一份copy,它与原数据分隔寄存,并且能够把这份数据康复到早前的状况,之所以康复,一般是由于原数据受某种原因影响而遭到删去或损坏
2.4. 备份有必要是一份copy
-
2.4.1. copy是对原数据所做的逐字节重制,它的内容与原数据相同
-
2.4.2. 对文件所做的copy,还应该包含一切的metadata(元数据/后设数据),尤其是与安全及权限有关的装备数据
-
2.4.3. 有必要依靠原数据而存在的“copy”,都不是真实的copy,它们只能算作虚拟的copy(virtual copy)
-
2.4.4. 经过把快照重制到另一个体系上而构成的copy,要比一般的copy更好
-
2.4.4.1. 这样的copy里边,每个磁盘中的数据都是从同一个时刻抓取的,就算重制这份copy所花的时刻很长,也能保证这一点,而不像一般的copy,难以保证这些磁盘中的数据会不会在制造copy的过程中有所改变
-
2.4.5. 经过快照来制造备份是适当棒的
-
2.4.5.1. 依靠原数据而存在的快照,不是一份合格的copy,你有必要把它重制(也便是仿制)到其他当地,才干让它成为一份真实的copy
-
2.4.6. 在IT范畴,有一些snapshot(快照)确实是copy
-
2.4.6.1. AWS Elastic Block
Store(EBS)的snapshot
- 2.4.6.2. image copy(镜像仿制)
> 2.4.6.2.1. 它们是在逐字节地仿制原数据,适当于对原数据做了一个镜像
2.5. 备份有必要与原数据分隔寄存
-
2.5.1. 假如你把copy保存在了跟原数据相同的文件体系、核算机或数据库里边,那么你做的仅是快捷仿制,而不是真实的备份
-
2.5.1.1. 起不到对原数据做备份的效果,它仅仅出现在原数据周围,便利你随时取用罢了
-
2.5.2. 做备份时必定要把数据保存在远离原数据的当地
2.6. 备份有必要能够用来康复数据
-
2.6.1. archive(档案)也是一种copy,并且也是跟原数据分隔寄存的,但archive并不能算作备份
-
2.6.1.1. archive不是用来康复数据的,它们是用来获取数据的,这跟康复数据不是一回事
-
2.6.2. 只要那种能够在原数据受损时用来康康复数据的copy,才是备份
2.7. 什么是康复restore
-
2.7.1. 一种经过备份让数据回到早前状况的操作
-
2.7.2. 获取(retrieve)操作针对的是档案
-
2.7.2.1. 从档案中履行获取操作,所得到的是某个比较大的时刻段内的许多数据
-
2.7.3. 康复一般是为了让服务器或文件体系的状况回到间隔当时较近的某个点
-
2.7.4. 康复数据时,咱们一般总是会运用最近制造的那个备份
-
2.7.5. 最为重要的一点,在于你有必要知道自己想把这个有问题的东西康复到它在哪一时刻的姿态
-
2.7.6. 找到你在数据受损之前的某个时刻所制造的备份,并经过该备份来康复某一服务器、VM或应用程序里某一区域(例如某个数据库、某个文件体系、某个目录、某个bucket)中的一条或多条数据
2.8. 3-2-1准则
-
2.8.1. 至少对数据做3个版别的备份
-
2.8.1.1. 除原数据之外还有3个版别
-
2.8.1.2. 3是下限,而不是上限
-
2.8.2. 把备份放在2个不同的介质中
-
2.8.2.1. 不要把一切的备份都保存到同一介质中
-
2.8.2.2. 原数据与你给该数据所做的备份必定不能保存到同一介质上
-
2.8.2.3. 有必要把备份放在跟原数据不同的磁盘上,或许寄存到与你要维护的这台核算机不同的另一台核算机上
-
2.8.2.4. 不要把备份寄存在间隔受维护的核算机很近的当地
-
2.8.3. 将其间1份放在远处
-
2.8.3.1. 让其间一份数据离场
-
2.8.3.2. on-site(在场/在线/上线)与off-side(离场/离线/下线)这样的二分法
-
2.8.3.3. 把其间一份副本放到间隔受维护数据适当远的某个安全地址
-
2.8.3.4. 能够让备份远离原数据,以便在数据遭受灾祸时,拿这些备份磁带来康复
-
2.8.3.5. 用来做灾祸康复的这份副本,必定要放在远离各种灾祸的当地
-
2.8.3.6. 要把这些备份放在一个跟你要维护的应用程序不同的当地
-
2.8.3.7. 最好能在另一个区里独自创立一个账号,让这个账号专门用来保存备份数据,并把其他区里的那些账号所制造的备份全都汇给这个账号
3. 什么是档案
3.1. 把备份从某种比较贵重的介质移动到费用较低的介质上,以便长时刻保存,这不能称为archiving a backup(“给备份做档案”或“给备份归档”)
- 3.1.1. 只不过是把备份移动到了一种便于长时刻保存的介质上
3.2. 旧的备份不会自动变成档案
3.3. 假如要档案,那有必要去制造档案
3.4. 档案是寄存在另一个当地的数据副本,是一种用来做参阅的副本,其间存储着必要的metadata,让咱们不必指出来历,就能找到所需的数据
3.5. 档案也有必要是一份完好的副本,无须依靠原数据即可独立存在
3.6. 为了不同的方针而保存档案与备份的,咱们获取档案与备份的理由不同,档案与备份的保存方法及获取方法也不同
3.7. 档案是为了参阅而制造的
-
3.7.1. 档案并不是用来把服务器或文件康复到本来的容貌
-
3.7.2. 一般是用来查找数据的,至于为什么要从档案里找数据,其原因或许跟最初创立数据的原因不同
-
3.7.3. 电子邮件档案(email archive)一般用来做电子取证(e-discovery,也称电子查找)
-
3.7.3.1. 这种档案的保存方法也不方便于你经过它来康复整个电子邮件数据库
-
3.7.4. 针对电子邮件与其他数据制造档案,而不是在制造备份
-
3.7.5. 假如有一种机制能够对这些数据制造真实的备份,那么你对备份的查询方法,应该跟你对这些档案的查询方法不同
3.8. 档案里有附加的metadata
-
3.8.1. 附加的metadata自身就包含在了你所归档的东西里边
-
3.8.2. 档案并不要求你在查询时供给原服务器或原数据库的姓名,不然它就不是真实的档案了
-
3.8.3. 在制造档案之后自动增加metadata
-
3.8.4. metadata是为了便于你从档案中获取数据而设的,并不是为了让你用这份档案来康复数据
-
3.8.5. 为康复数据而制造的东西叫作备份,其间无须包含这些metadata,由于它的首要方针是便于康复,而不是便于查询
3.9. 获取跟康复有很大差异
-
3.9.1. 获取数据(或许说,调取档案)时,体系会依据档案的内容以及该档案所附加的metadata,把互相有关的一组信息会聚起来,回来给用户
-
3.9.2. 获取数据的时分,你寻觅的一般是信息,而并不是服务器或文件
-
3.9.3. 感兴趣的是文件里边的内容,而不是文件自身
4. 维护备份数据与档案数据
4.1. 备份与档案都很重要
- 4.1.1. 不管你是创立备份、创立档案,仍是既做备份又做档案,你都期望它能够坚持原样,而不要遭到炸毁、损坏或篡改
4.2. 加密
-
4.2.1. 想要避免有人歹意拜访你的备份数据,最好的方法便是加密
-
4.2.2. 加密并不能避免坏人删去或偷盗你的备份数据,但就算他们拿到了备份,也读不明白其间的内容
-
4.2.3. 避免有人经过盗取备份来敲诈
4.3. 设置屏障
-
4.3.1. “air gap”指的是坐落受维护体系与维护它的那个体系之间的一道屏障
-
4.3.2. 屏障便能够避免这次灾祸或进犯把你的数据维护机制损坏掉,让你能够经过该机制来康复受损的体系
-
4.3.3. 最好的方法便是让受维护体系与维护它的体系,在地理位置上离得远一些,并且对它们之间的通讯途径施加操控
-
4.3.3.1. 两个体系之间的通讯途径,操控得越严厉越好
-
4.3.4. 进犯不单影响主体系,并且会把备份体系也一起感染,导致咱们没方法经过备份体系来康复主体系
-
4.3.4.1. 假如备份数据放在装有Windows体系的备份服务器上,并且能够经过该体系中的某个目录直接得到拜访,那么勒索病毒在感染主体系之后,就有或许经由这个目录损坏你的备份数据
-
4.3.5. 物理屏障
-
4.3.5.1. 曾经咱们用的都是物理屏障
-
4.3.5.2. 不只能让主体系与备份数据之间相隔很远,并且能让咱们施加多层防护,以记载这些磁带的交代状况,然后保证它们不会由不应触摸磁带的人拿到
-
4.3.5.3. 在磁带没有受损的前提下,只要一种常见的场合需求运用离场磁带,那便是咱们对DR(灾祸康复)方案履行全面测验的时分
-
4.3.5.4. 对保管方的保管服务做浸透测验(penetration test)
-
4.3.6. 虚拟屏障
-
4.3.6.1. 虚拟屏障(virtual
air gap)
- 4.3.6.2. 现在,咱们备份数据时或许底子就不会运用磁带
> 4.3.6.2.1. 进犯面要比本来大得多,并且进犯者从一个体系跳到另一个体系的概率,也比本来高得多
- 4.3.6.3. 禁用或约束运用RDP(远程桌面协议)
> 4.3.6.3.1. RDP是经过勒索病毒发起进犯的人很喜欢运用的一种途径
> 4.3.6.3.2. 应该禁用RDP,或对其加以约束,在备份体系上尤其要这样做
> 4.3.6.3.3. 日常作业中应该不会频频地用到RDP,因而,在衔接备份服务器的远程桌面时多一些过程,并不会形成太大的不方便
- 4.3.6.4. 运用不同的操作体系
> 4.3.6.4.1. 尽量给备份服务器装置一个跟主服务器不同的操作体系
- 4.3.6.5. 把寄存备份数据的当地跟其他东西离隔
> 4.3.6.5.1. 不要让方针去重设备的磁盘成为备份服务器所运用的操作体系里的一个盘或一个挂载点,避免有人经过这个盘或这个挂载点随意拜访设备中的备份数据
- 4.3.6.6. 运用目标存储体系
> 4.3.6.6.1. 假如备份体系能够把数据写入目标式的存储体系,而不是惯例的文件体系,那就应该敞开这项功用
> 4.3.6.6.2. 选用目标存储协议来保存备份数据,能够涣散这些数据,以避开常见的网络进犯
> 4.3.6.6.3. 选用根据目标的存储体系来保存备份数据,也要比经过NFS或SMB愈加安全
- 4.3.6.7. 运用不行变的存储机制
> 4.3.6.7.1. 不行变存储(immutable
storage),也便是说,你能够规则,但凡写入该体系的数据,都会存留必定时刻,在这段时刻内,即使你自己也无法删去该数据
> 4.3.6.7.2. 备份体系要是能把数据写入这种存储体系,那就应该这样做
> 4.3.6.7.3. 在目标存储体系里创立一个数据桶(bucket),并把不行变功用翻开
- 4.3.6.8. 运用磁带保存备份数据
> 4.3.6.8.1. 把数据放在磁带里边,并让它远离你的数据中心,要比其他屏蔽方法都更为保险
- 4.3.6.9. 运用(特制的)备份服务
> 4.3.6.9.1. 要找的备份服务,应该是那种让备份数据简直无法经过网络拜访到的备份服务
4.4. 不行变性
-
4.4.1. 有必要保证备份与档案数据不会遭到无意或歹意的擦除与损坏
-
4.4.2. immutability,也叫不变性
-
4.4.3. 某物具有不行变性(或许说,某物不行变),指的便是任何人(包含有特权的人)或任何东西都无法修正该物
-
4.4.4. 保存期(retention period)当然能够修正,但是新的保存期针对的仅仅修正之后存入的数据,它不会影响修正之前所存入的备份与档案数据
-
4.4.5. 没有什么东西能做到绝对不行变
-
4.4.5.1. 写入任何一种存储介质的数据,都有或许遭到炸毁。单次写入屡次读取(Write-Once-Read-Many,WORM;单写多读)式的磁带与光盘,仍然抵不住火烧
-
4.4.6. 有必要施加多种管控方法以保证不行变性
-
4.4.6.1. 曾经好像只要一种不行变的存储介质,便是光盘,但现在基本上没人用了
-
4.4.6.2. 云端存储处理了很多与怎么避免有人亲自触摸存储体系相关的问题,一起它又支撑传统的存储方法所具有的各种特性
-
4.4.7. 不行变并不意味着不会遭到损坏
-
4.4.7.1. 不行变的体系让咱们能够坚信某个目标历来都没有发生改变
-
4.4.7.2. 体系仍然无法避免有人亲自触摸该体系,并且也无法避开其他危害
> 4.4.7.2.1. 磁带或许让火烧掉,即使这是一盘单读多写式的磁带,也防不住火,它仍是会让火烧掉
-
4.4.8. 许多声称不行变的机制其实并非真实的不行变
-
4.4.8.1. 假如备份管理员能够在创立齐备份数据之后,减缩该备份的保存时刻,那么这实际上就不是真实的不行变
-
4.4.8.2. 备份管理员能否删去现已做好的备份(或许能否让还没有到期的备份提早过期)
> 4.4.8.2.1. 假如能够,那么这样制造出来的备份,其实并非真实的不行变