亚马逊云科技 可观察性和运维新功能演示

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 在这个COP339的后续演示中,我们将看到亚马逊云科技如何帮助管理和洞察您的应用程序和基础设施,横跨多个环境。这个闪电式演讲深入探讨了亚马逊云科技的最新发布,并通过IT管理工具和可观察性解决方案的演示展示了相关功能。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共600字,阅读时间大约是3分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 演讲者首先表示,此次演讲的目的是向观众展示亚马逊云科技近期推出的关于观察和运营的一些新功能。这些功能主要包括在re:Invent的主题演讲中重点介绍的CloudWatch Application Signals,以及去年推出的一些其他创新特性。作为一名具有实际操作经验的人员,演讲者在介绍背景时通过概述操作事件的生命周期所涉及的三个核心阶段(检测、调查和修复)来进行阐述。他强调,尽管通过报警和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)可以快速检测到问题,但一旦找到根本原因,修复速度也很快,然而,调查阶段通常在整个关键事故处理过程中占据大部分时间。 为了展示如何改进这一过程,演讲者进行现场演示了一个名为Pet Clinic的示例应用。这个虚拟企业旨在帮助宠物主人找到世界各地的兽医诊所。该应用本身在[Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail)上运行。演讲者通过将Pet Clinic添加到CloudWatch的My Applications作为一个“应用”,向观众展示了如何专门查看与该应用相关的资源,而非整个亚马逊云科技账户。该仪表板整合了诸如Security Hub的安全发现、Cost Explorer的成本数据以及来自CloudWatch的运营洞察等相关的小部件,所有这些都已过滤到此应用的上下文。 接下来,演讲者展示了为EKS集群启用Application Signals如何能够自动发现Java应用程序代码内的微服务和操作,而无需任何自定义监测。它识别出了构成Pet Clinic的四个核心服务。通过对每个服务进行深入分析,演讲者可以查看每个服务的每个操作的详细指标、轨迹和依赖关系图。为了展示如何解决一个问题,演讲者点击了正经历每分钟故障的Owner服务的“发布”操作。这立即显示了相关联的轨迹,提供了导致失败的端到端上下文。分析时间线揭示了这个问题的根本原因——一个被SQS速率限制限制的EKS容器正在调用PurgeQueue SQS API。 演讲者强调了一种方式,操作员可以通过这种方法快速找到高级应用程序仪表板中特定操作的追踪信息。相较于传统的调试方法,这种方式能实现更快的调查速度。接着,演讲者谈到了CloudWatch现在可以定义服务水平目标(SLO)和服务水平指标(SLI)来跟踪性能目标。任何违反这些标准的情况都会触发CloudWatch警报,以便进行主动通知。他展示了一个针对Pet Clinic应用程序的示例SLO,其中一个是由于不现实的延迟阈值而被标记为“不健康”的例子。最后,演讲者展示了CloudWatch日志中的一个新功能——异常检测。通过一个示例查询,他展示了如何自动检测模式并在不同时间周期内进行比较,从而揭示新的问题或变化。他还展示了CloudWatch日志现在如何能够自动识别异常并创建警报以通知操作员。总的来说,演讲者总结了他所展示的这些端到端的可观察性功能如何能够极大地改善操作员在管理关键生产应用程序和服务过程中的检测、调查和修复工作流程。通过运用诸如应用信号、分布式追踪和智能分析等功能,可以更快地识别和理解问题。 **下面是一些演讲现场的精彩瞬间:** 事件生命周期分为检测、调查和修复三个阶段。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_0.png) 领导者回顾了其作为操作员在处理涉及这三个阶段的操作事件时的过往经验。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_1.png) 在操作事件中,调查阶段往往需要花费最多的时间。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_2.png) 领导者强调了其使用的运营仪表板,该仪表板展示了特定应用的延迟指标。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_3.png) 领导者展示了如何使用X-Ray自动发现应用程序中的服务和依赖关系,而无需使用任何其他工具。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_4.png) 亚马逊云科技的新日志监控功能允许用户快速分析日志数据并识别模式,就像在大量的信息中寻找一根针一样容易。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_5.png) 领导者总结了演示的主要观点,并邀请观众参加当天稍后的附加会议以了解更多相关信息。 ![](https://d1trpeugzwbig5.cloudfront.net/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations/images/rebranded/COP349-Demonstration_of_what_s_new_with_AWS_observability_and_operations_6.png) ## 总结 在本次re:Invent上,部分展示了最新的可观察性功能,用于检测和调查亚马逊云科技上的运行事故。其中一个关键功能是CloudWatch Application Signals,它能够自动发现仪表化应用程序中的服务和依赖项,而无需手动设置。这一功能通过关联来自X-Ray的分布式追踪,展示了如何将故障追溯到其根本原因。 另一个关注点是CloudWatch日志中的全新异常检测功能。这可以自动识别异常模式,并将其与历史数据进行比较,以检测有意义的变化。Logs Insights现在还可以检测到错误、错误、分配优先级和持续时间等方面的异常波动。 最后,展示了如何使用CloudWatch服务级别目标来跟踪应用程序性能是否符合目标。用户可以在Application Signals的服务和操作上定义SLO(服务级别目标)。一旦违反这些目标,就会触发CloudWatch警报,以驱动自动化修复。 总之,这次峰会强调了亚马逊云科技在改进整个事故生命周期中的可观察性的强大新功能,从快速检测问题到理解根本原因,再到设定最优性能的目标和警报。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭