用于提高恢复能力的备份和灾难恢复战略

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 在本论坛中,了解使用亚马逊云科技服务保护本地和基于云的应用程序免受停机和数据丢失影响的不同策略。了解云技术如何简化灾难恢复实施,同时降低总体拥有成本 (TCO)。此外,深入了解亚马逊云科技弹性灾难恢复,并了解该服务如何帮助组织实现秒的恢复点目标 (RPO) 和分钟的恢复时间目标 (RTO),以及防范、响应勒索软件事件和从勒索事件中恢复。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共1100字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 在制定备份和灾难恢复策略之前,演讲者首先强调了明确韧性需求的重要性。他强调,我们需要提前定义关键指标和目标,以便选择能满足业务需求的解决方案。最常见的两个指标是恢复点目标(RPO)和恢复时间目标(RTO)。例如,如果每天进行备份,那么RPO将为24小时,因为在最坏的情况下,你可能损失多达一整天的数据。RTO是指在发生故障后,系统重新运行之前的最大可接受停机时间。这些要求将因组织的工作负载和系统而异。例如,计费应用程序可能需要少于一小时的RTO,而市场营销系统可能能够在没有重大业务影响的情况下承受数小时的停机时间。 演讲者强调,我们需要提前为每个应用程序识别这些目标,以便我们可以设计正确的备份和灾难恢复解决方案来满足它们。接下来,他覆盖了其他必须考虑的因素,如部署模式(内部与云、跨区域与跨AZ)、备份策略(保留期限、频率)、网络配置以及生产、DR和备份环境之间的账户拓扑。例如,合规要求通常驱动更严格的备份保留政策,以保持数月或数年的数据。他建议在规划开始时充分考虑所有这些因素。 演讲者强调,使用云的灾难恢复的一个关键好处是弹性——只在需要时按需支付所需资源的能力。与传统的企业内部灾难恢复相比,这种方法更加灵活且经济实惠。传统的企业内部灾难恢复要求组织提供一个完整的备用数据中心,以备在发生故障时进行切换,但这往往非常昂贵。使用云,只需持续提供最少量的资源用于复制和数据传输。当实际故障发生时,云资源可以自动启动以在灾难恢复站点中提供完整的生产环境,仅在需要时使用,从而节省了大量成本。 演讲者详细阐述了亚马逊云科技提供的各种数据恢复选项,涵盖了从低成本备份和恢复至高可用性主动-主动解决方案。在选择恢复目标和成本时,总是需要在两者之间进行权衡。虽然备份和恢复提供较低成本的解决方案,但由于需要进行完全恢复,通常会导致数小时的RPO和数小时的RTO。相比之下,主动-主动和高可用性选项具有更短的RPO(秒级)和接近零的RTO,但需要不断调配冗余的生产环境,因此成本较高。其他选项如导火索和暖备用则介于两者之间,具有较短的RPO(分钟级)和较长的RTO(小时级)。目标是针对每个应用程序找到恢复目标和成本之间的最佳平衡。 Elastic Disaster Recovery的一些优势包括极快的恢复时间(仅几分钟)和非破坏性测试功能。持续的异步块级复制过程允许创建最少的重复点。在DR帐户中,仅持续调配轻量级的临时资源,以优化成本。在启动测试或实际故障转移事件时,会按需启动完整的生产资源。网络和配置复制与数据复制同时进行,确保在DR站点中准备好运行一个完整的环境。 对于跨区域DR,只需反转复制方向即可简化失败回退。演讲者强调,一些客户已采用此功能定期在不同地区之间切换,作为一种简单的“夏季度假屋/冬季度假屋”策略。按照预定的时间间隔在不同地区之间进行故障转移,只是为了锻炼和验证其灾难恢复能力。 此外,演讲者还介绍了将备份和恢复用于可以容忍较长恢复时间的非关键工作负载的方法。这提供了一个更低成本的选项,具有数小时的RPO和RTO。恢复发生在原始工作负载之外的不同可用区,以处理区域停机。跨区域的备份复制提供了额外的保护,并在各个地区提供了恢复选项。 为了确定何时需要恢复,必须实施一个检测功能。这个过程并不总是显而易见的。在制定保留策略时,应权衡成本和按需回溯以恢复干净数据的能力。短期备份可能会更频繁地进行,而长期备份则可以较少频率进行,以满足合规性要求。例如,政策可以规定每月拍摄每日快照,然后每周拍摄六个月的快照,最后每年每月拍摄五年的快照,以满足合规性。对于勒索软件恢复,演讲者强调了在无法由攻击者访问或修改的独立“数据掩体”账户中维护不可变备份副本的重要性。警报应监控备份是否停止或配置是否更改。恢复工作流程可以将数据从掩体恢复到第三个DR账户。通过将灾难恢复复制的紧密RPO与快速的威胁检测相结合,可以在发生重大加密之前几乎立即恢复,从而最小化数据丢失。例如,如果仅在开始加密后的10分钟检测到勒索软件,则滚动回仅在那之前的恢复点将数据丢失减少到仅仅那10分钟的时间窗口。总的来说,演讲者强调需求必须推动技术选择。像Elastic Disaster Recovery和亚马逊云科技Backup这样的服务允许优化跨一系列使用情况的成本和恢复目标。正确测试和备份数据的隔离至关重要。他鼓励观众花时间定义要求并探索可用服务以找到每个应用程序的正确平衡。演讲者提供了关于如何在亚马逊云科技上设计有弹性的备份和灾难恢复解决方案时考虑的关键因素的深思熟虑概述。通过提前投资时间定义精确的RPO和RTO要求,企业可以将其解决方案定制以满足其跨各种选项的需求。云的弹性提供比传统的在境内模型更具成本效益的选项。新的解决方案如弹性灾难恢复允许以较低的成本平衡激进的治疗目标。不可变的备份、隔离的账户、定期测试和对勒索软件攻击的快速检测和响应也是重要因素。通过适当的规划和努力,公司可以实施备份和灾难恢复战略以满足其在亚马逊云科技上的韧性要求。 **下面是一些演讲现场的精彩瞬间:** 在制定数据保护策略之前,首先要明确需求。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_0.png) 据领导者介绍,客户通常会先将亚马逊云科技用作灾难恢复站点,然后逐步完全迁移至云端。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_1.png) 他们建议客户以成本效益的方式并不影响生产系统为前提,定期进行灾难恢复能力的测试。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_2.png) 领导者还讨论了如何在勒索软件攻击发生时及需要进行恢复的情况下进行检测。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_3.png) 亚马逊云科技提供灵活的数据保留策略以满足动态灾难恢复需求,如初始阶段更快地存储快照,随后逐渐降低存储频率。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_4.png) 通过块级复制技术,可以实现紧凑的快照,以便在检测到勒索软件时进行回滚,从而最大程度地减少潜在的数据丢失。 ![](https://d1trpeugzwbig5.cloudfront.net/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience/images/rebranded/ARC208-Backup_and_disaster_recovery_strategies_for_increased_resilience_5.png) ## 总结 演讲者在讨论选择备份或灾难恢复策略时,强调了首先需要确定诸如RPO和RTO等弹性需求的重要性。接着,他对比了云端和内部灾难恢复的优劣,包括灵活性和按需付费的模式。在灾难恢复方面,亚马逊云科技提供了多种平衡成本与恢复时间的选择。通过持续、增量复制到备用资源的弹性灾难恢复方案,以较低成本实现了快速的分钟级RTO。对于非关键应用程序,初始备份采用每小时恢复粒度,随后逐渐增加间隔。演讲者强调定期进行恢复测试的重要性。针对勒索软件攻击的弹性,通过不可变快照实现跨账户的生产和备份/灾难恢复隔离。灾难恢复通过频繁捕获块变化来实现较低的RPO。这样可以在最短的时间内检测到并恢复到加密前的最干净状态,从而最大程度地减少停机时间和数据丢失。演讲者鼓励企业明确需求,评估亚马逊云科技的弹性服务(如弹性灾难恢复和备份),并对恢复过程进行测试。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭