|
构建架构时,我们必须构建可靠、安全、最优的架构。为了实现这一点,我们需要一个参考或 最佳实践 ,作为我们正在构建的架构的参考和比较。如果没有这些最佳实践,也许在云中创建和运行应用程序时,您经常会想,“我这样做对吗?”。为了回答这个问题,AWS 创建了一个架构完善的框架,该框架有五个主要支柱,作为构建云的基础。其中一个支柱是可靠性支柱,作为验证云架构可靠性的一种方式。
您是否知道,本文直接摘自Architecting on AWS 课程(在 AWS 上构建云架构)中的子模块之一,该课程由 Dicoding 专家团队与行业从业者一起编译,并由 AWS 团队验证(Amazon Web服务)?
目前,AWS 在后端开发人员领域 西班牙手机号码列表 提供印尼语课程,并通过云和后端开发人员奖学金计划奖学金 免费提供。奖学金是公开的、无条件的、完全免费的。要到达那里,只需在aws.dicoding.com注册并填写简短的注册表即可。注册后,一定可以得到!
Amazon Web Services 为印度尼西亚提供 100,000 份奖学金
可靠性支柱作为验证云架构可靠性的一种方式
可靠性的支柱涉及系统从干扰中恢复、动态获取和分配计算资源以满足需求以及减轻配置错误或其他临时干扰等干扰的能力。
您是否知道,在传统数据中心环境中确保系统的可靠性并不容易。任何地方都可能出现问题,比如我们的系统缺乏 冗余 、缺乏自动化、缺乏弹性。
通过应用可靠性支柱的原则,我们可以防止上述问题的发生。因此,在设计系统架构时要注意高可用性、容错性和 冗余等方面 。
在云中实现可靠性有 5 个设计原则:
发生故障时自动恢复
监控您的工作负载以匹配 KPI(关键绩效指标)。当超过阈值时,您可以触发自动化。该 KPI 应该是业务价值的衡量标准,而不是运营服务的技术方面。这使您可以自动获取通知并跟踪自动恢复过程和故障修复的故障。即使采用更先进的自动化,您也可以在故障发生之前进行预测并从中恢复。
测试恢复过程
在本地环境中,通常会进行测试来证明工作负载在某些场景下可以正常工作。通常,测试不用于验证恢复策略。同时,在云中,您可以测试工作负载中如何发生故障并验证您的恢复过程。您还可以使用自动化来模拟不同的故障或重新创建导致先前故障的场景。此方法公开了一条故障路径,您可以在实际故障场景发生之前对其进行测试和修复,从而降低风险。
执行水平扩展以提高工作负载可用性
用多个较小的资源替换一个大型资源,以减少单个故障对整个工作负载的影响。将请求分布到多个较小的资源中,以确保它们没有共同的故障点。
停止估计容量需求
本地工作负载失败的一个常见原因是资源饱和,即对工作负载发出的请求超出了工作负载的容量(这通常是拒绝服务别名 DoS 攻击的目标)。在云中,您可以监控需求和工作负载利用率,并自动添加或删除资源。这样,您就可以保持最佳水平来满足需求,而不会出现供应过剩或不足的情况。尽管仍然存在限制,但一些配额是可以控制和管理的。
使用自动化管理变更
必须使用自动化来更改基础设施。需要管理的变更包括以后可以跟踪和审查的自动化变更。
有关更详细的实施说明,您可以在可靠性支柱白皮书中找到,链接为 可靠性支柱 – AWS 架构完善的框架。
本文讨论的支柱只是 AWS 架构完善框架的以下五个支柱之一:
卓越运营
安全
可靠性
性能效率
成本优化
对五个支柱的深入讨论是与 Amazon Web Services 和其他行业参与者开发的后端开发人员学习路径的一部分。如果您需要奖学金才能进入此学习路径,请注册云和后端开发人员奖学金计划。
|
|