读数据维护:作业负载的可恢复性03构建自己的结构
1. 构建自己的结构
1.1. 数据维护作业会影响本安排的各个方面
-
1.1.1. 听取各种人员的定见并征得他们的赞同,其间有技能人员,也有非技能人员
-
1.1.2. 树立各种评定委员会(review board)
1.2. 文档模板
-
1.2.1. 方针论述
-
1.2.1.1. 尽或许简练地论述这份文档的方针,篇幅控制在一段或两段之内
-
1.2.2. 履行大纲
-
1.2.2.1. 要在此部分给具有批阅权的人供给满意的信息
-
1.2.3. 修订前史
-
1.2.3.1. 一切的文档都应该及时更新
> 1.2.3.1.1. 随时应对改变
-
1.2.3.2. 协助你了解正在看的是哪个版别,并且让你知道文档是通过了怎样的修订才变成现在这样的
-
1.2.4. 签名页
-
1.2.4.1. 数据维护方案对你的安排至关重要,因而在开发这样一个项目时,有必要明确责任
-
1.2.4.2. 保证每一位要害的批阅人与主题专家(Subject Matter Expert, SME)都乐意遵从该方案,并在文档的终究版(也便是承认版)上签名
-
1.2.5. 作业战略/作业范围
-
1.2.5.1. 有助于把该文档所要着重的某些主题给界定清楚
-
1.2.6. 词汇表(术语表)
-
1.2.6.1. 对参加批阅的非主题专家来说特别有协助
-
1.2.7. 附录
1.3. 评定委员会/咨询委员会的作业流程
-
1.3.1. 树立一套杰出的评定体系,能够协助你聚合不同的观念,让你不会疏忽掉某个与该体系的部件或需求有重要联络的定见
-
1.3.2. 需求评定
-
1.3.2.1. 安排各个部分的成员都来参加需求评定这一环节,并且还要有一名高管,以保证整个安排都能对这个项目感到满意
-
1.3.2.2. CIO(Chief Information Officer,首席信息官)是很适宜的人选
> 1.3.2.2.1. 既了解安排所运用的技能,又知道安排会以何种战略来运用这些技能
-
1.3.3. 规划评定
-
1.3.3.1. 从那些与特定技能有关的团队里选择成员来组成规划评定委员会(Design Review Board, DRB),这些人能够供给自己的见地,让你知道某项技能应该如安在本安排中完结
-
1.3.3.2. 架构评定委员会(Architecture Review Board, ARB)
-
1.3.3.3. 初步规划评定(Preliminary Design Review, PDR)
> 1.3.3.3.1. 先让规划方案阅历这个小环节,以保证该方案现已恪守了相关的要求
- 1.3.3.4. 出产预备情况评定(Production Readiness Review, PRR)
> 1.3.3.4.1. 在规划方案已悉数做好并通过终究测验之后履行的,它的方针是让咱们都能够终究再看一遍,以承认没有漏掉什么东西
-
1.3.4. 操作评定
-
1.3.4.1. 在出产环境(也便是正式的作业环境)中运转该服务的运营团队招集在一起,让他们参加这一环节,以充沛了解自己所要履行的是什么样的操作
-
1.3.4.2. 完结操作评定(operation review,也叫运营评定)后,应该构成一份运用阐明,以充任该体系的用户手册
-
1.3.5. 改变评定
-
1.3.5.1. 改变咨询委员会(Change Advisory Board, CAB),该委员会应该是技能安排里的一部分,用来在实施终究方案之前,把方案里有或许对本安排的日常运营形成影响的那些改变之处审阅一遍
-
1.3.5.2. 查看方案里说到的改变对本安排是否适宜,以防其损坏该安排的全体作业
-
1.3.6. 项目办理
-
1.3.6.1. 要运用稳健的项目办理手法来推动数据维护方案,这能够协助你和谐作业,给相关人员供给资源并安排好各项使命的时刻
-
1.3.6.2. 让你总是能够准时拿出应该交给的东西,并保证这个方案顺畅实施
2. 规划并构建数据维护体系
2.1. 在规划环节,你的方针跟搜集需求时相似,也是让咱们对规划方案达到一致
2.2. 起草多种规划方案
-
2.2.1. 每种方案的价格、实践康复时刻(Recovery Time Actual, RTA)、实践康复点(Recovery Point Actual,RPA)都不同,并且履行该方案的人所需具有的操作水平也不相同
-
2.2.2. 第一种方案,总应该是那种“不管要什么都尽量安排,别担心花多少钱”的方案,该方案只考虑怎样满意需求文档里界说的RPO与RTO
-
2.2.2.1. 让咱们有一个很好的参照物,知道这个所谓的完美方案或抱负方案需求花费多少资金
-
2.2.3. 第二好的方案(second-best solution,次佳方案)
-
2.2.3.1. 本身或许有一些问题需求稍后处理
-
2.2.3.2. 方案减少了初期需求投入的资金,让咱们能比及今后真实需求履行某些操作时再投入
-
2.2.4. 毛病是没有什么规则的,因而,把康复出来的这些文件都收拾到毛病之前的正常情况,并不像你想的那么轻松,有时还不如爽性少备份一些文件,比及康复数据时再重制那些丢掉的文件
-
2.2.5. 为了满意RTO,你有必要尽快把数据康复到正常情况,为此,你或许会减少你所康复并收拾的数据量,可是又不能减得过分,那样就无法满意RPO了
-
2.2.5.1. 有必要把话说得很周到
2.3. 评定规划方案
-
2.3.1. 规划评定委员会(DRB)
-
2.3.2. 依据终究的需求文档做个小结,然后从这个小结动身,深化探究其间某些细节问题的具体处理方法,并把这些做法记载下来
-
2.3.2.1. 必定要把你对RPO的要求写下来,并且要写出你为了满意RTO还有必要做哪些作业
-
2.3.3. 比及承认终究的规划方案之后,你就能够将其完整地写成文档,并让咱们轮番签字了
2.4. 选择部件并以此构建数据维护体系
-
2.4.1. 精确测定康复数据所花的时长,以承认该体系满意了需求文档里边写的SLA
-
2.4.2. 制定操作方案并编写操作文档了
3. 编写操作文档
3.1. 有必要把该预备的文档全都预备好,你的作业才算完结
- 3.1.1. 有必要把该体系的用法写成文档,让没有参加规划的那些人也能理解怎么运用该体系,而不需求你在旁边辅导
3.2. 界定每个人的操作人物
-
3.2.1. 每个人都有必要知道自己在这个新数据维护体系里边的位置
-
3.2.2. RACI图
-
3.2.2.1. R(Responsible)是履行人
> 3.2.2.1.1. 实践履行使命的人
- 3.2.2.2. A(Accountable)是担任人
> 3.2.2.2.1. 为使命顺畅完结或产品顺畅交给而担任的人
- 3.2.2.3. C(Collaborator)是协作人
> 3.2.2.3.1. 协助实践履行人完结某项使命的人
- 3.2.2.4. I(Informed)是知情人
> 3.2.2.4.1. 需求了解使命履行进展的人
- 3.2.3. 必定要让ORB(Operation Review Board,运转评定委员会)检查你的RACI图,并向他们提出问题,以此搞清楚你的这个新体系会不会对本安排形成什么影响
3.3. 编写操作文档
-
3.3.1. 要保证一切的文档都已及时更新,并保证这套文档现已把这个数据维护体系所触及的人全都掩盖到了
-
3.3.2. 操作手册、运转阐明或规范操作流程(Standard Operating Procedure, SOP;也称为规范作业程序)
-
3.3.3. 从在日常作业中触摸这个数据维护体系的人的视点写出来的东西是很有价值的
3.4. 劝说咱们编写文档
-
3.4.1. 咱们都知道但却都不乐意去碰的工作,也便是编撰文档
-
3.4.2. 文档是必不可少的,而这样的阐明书、手册或许SOP,最好能由拿这个体系履行实践使命的人来写,而不该该由从未做过这些事的人来写
3.5. 文档模板
-
3.5.1. 操作阐明(也便是SOP或许操作手册)应该像早前的规划文档与需求文档相同,遵从相应的模板
-
3.5.2. 文档里要有服务的概述、文档的修订记载,以及一张签名页,让每个与履行该服务有关的部分都签字赞同
-
3.5.3. 每一份清单都对应于日常作业中的某一项惯例使命
-
3.5.3.1. 假如操作人员的时刻比较急迫,那么能够把手册复印一份,每做完其间一项,就在此项前面的框里做个记号
-
3.5.4. FAQ(Frequently Asked Question,常见问题解答)区
-
3.5.4.1. 用来具体解说咱们在操作过程中或许会遇到的一些复杂问题
-
3.5.5. 联络信息
-
3.5.5.1. 必定要写上联络信息,其间包括各大供货商的联络方法,让咱们能够在某组件产生毛病时,联络到供给该组件的那家供货商里担任供给支撑的人员
-
3.5.5.2. 让操作人员能够联络到受这项服务影响的各个部分的担任人,以及应该得到告诉的各位高管
-
3.5.5.3. 联络信息里边要包括手机号,并且要注明遇到紧急情况时,应该优先以什么样的方法来联络这些人
-
3.5.6. 给操作人员列出有或许呈现的各种情况,并针对每种情况编撰一段小结,一起给出处理办法
-
3.5.6.1. tracking support ticket
-
3.5.7. 至少保存一份纸质的手册,把它放在活页夹里,让操作人员能够方便地查阅
-
3.5.7.1. 有了这份纸质手册,今后停电时你就不用在机房里用力回想服务器的发动次序了,而是能够直接翻开手册来履行操作
3.6. 归入作业环境
-
3.6.1. 但凡要对数据维护服务做出修正(例如要晋级软件或做数据康复测验),都应该先奉告CAB
-
3.6.2. 还没有CAB,那就建立一个这样的委员会
-
3.6.2.1. 再指定一位改变司理(change manager;也称改变办理者),这位司理专门担任CAB以及CAB所要监管的业务
-
3.6.3. 轮到CAB(改变咨询委员会)发表定见了
-
3.6.3.1. 你要修正的是什么?
-
3.6.3.2. 这个新的东西有没有通过全面测验?
-
3.6.3.3. 这次改变或许影响或许即将影响哪些服务?
-
3.6.3.4. 假如改变后的作用不抱负,咱们怎样退回到改变前的情况?
-
3.6.3.5. 这次改变安排在什么时候做?需求多长时刻才干做完?