## 视频
<video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/COP351-Application_monitoring_for_modern_workloads-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video>
## 导读
[Amazon CloudWatch](https://aws.amazon.com/cn/cloudwatch/?trk=cndc-detail) 应用信号可以自动检测应用程序,以跟踪业务目标的性能表现。它可以发现依赖关系并关联指标、追踪、日志和真实用户数据,简化诊断问题根本原因的过程。在本次会议中,了解如何通过构建自己的工具来节省时间和收入,并探讨如何加快解决性能问题的速度,以提高最终用户的满意度。
## 演讲精华
<font color = "grey">以下是小编为您整理的本次演讲的精华,共1800字,阅读时间大约是9分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font>
演讲者在热烈的氛围中欢迎2023年re:Invent最后一天的到来,并询问:“在过去的几周里,拉斯维加斯过得怎么样?”大部分观众热情地举手,表示他们在这次会议中度过了一周难忘的时光。接着,他提问:“在过去的一周里,有没有人因为严重的应用程序问题而受到关注?”这一次,仅有少数观众举手回应。
演讲者确认,负责维护高性能、可靠云应用程序的人员恰好参加了此次会议。他解释道,本次会议将深入探讨如何使用[Amazon CloudWatch](https://aws.amazon.com/cn/cloudwatch/?trk=cndc-detail) Application Signals来监控应用程序性能,从而在不需进行手动操作或定制代码的情况下提高工作效率。
他是Andreas Blomquist,亚马逊云科技的高级产品经理,专注于应用观测领域。他还提到了他的两位同事,亚马逊云科技的应用观测总经理Igor Sin和摩根大通的执行董事工程与架构师Anthony Giles,他们将为与会者带来一个具有说服力的客户案例。
Andreas概述了会议将涵盖的主要议题:首先,简要回顾[Amazon CloudWatch](https://aws.amazon.com/cn/cloudwatch/?trk=cndc-detail)在亚马逊云科技目前的状况。接下来,探讨客户在监控其应用程序时可能遇到的挑战,以及CloudWatch Application Signals如何改善这种体验。随后,Anthony将分享一个引人入胜的客户案例,阐述摩根大通如何通过运用站点可靠性最佳实践和CloudWatch来提升其应用程序的可靠性。最后,Igor将通过一个激动人心的演示,向观众展示服务运营商如何借助Application Signals提高效率。
尽管Andreas意识到这是一个面向300级会议的会议,但许多观众已是CloudWatch领域的专家。尽管如此,他希望提供一些关于CloudWatch作为亚马逊云科技的本地观测工具的背景信息,它提供了指标、日志和追踪的基本功能。他强调,自成立以来,CloudWatch一直以其可扩展性、效率和恢复力为核心原则。
优化后的预构建仪表板展示关键运行数据"
- 自动识别需要监控的应用服务
- 提供诸如容量、延迟、错误和故障等核心"黄金"指标
- 用于衡量服务质量的目标达标率
- 集中展示遥测数据的相关仪表板
据安德烈亚斯透露,Application Signals 已经在私有预览版中发布了针对Java应用程序的功能,让参会者能够亲身体验这些功能的实用性。
在这个时刻,安德烈斯邀请了来自摩根大通的安东尼·吉尔斯来到台上,向观众讲述一个关于监控应用的引人入胜的客户故事。
安东尼通过将监控应用与接力赛跑进行创造性地对比,强调了摩根大通希望为其客户提供可靠系统的愿望。他解释道,该公司每天处理高达9-10万亿美元的支付交易,因此系统可靠性和正常运行时间至关重要。他们利用以监控、可观察性和服务水平目标为核心的站点可靠性工程框架来支持他们的任务。
安东尼进一步强调,从起跑线成功传递接力棒围绕赛道奔跑,要满足服务水平目标,许多细微的事情必须完美完成。这反映了在银行应用中提供完美客户体验的复杂性,因为许多相互连接的服务都依赖于彼此。
安东尼自豪地解释说,摩根大通有57,000名技术专家或“跑得快的明星”,专注于为客户构建世界一流的产品和服务。他们在技术上投入巨资,仅在2022年就投资了150亿美元,确保团队拥有最好的设施、培训和工具。该公司的客户期待可靠的系统,因此他们努力工作以保护客户的利益和保护公司。
在详细说明他们的站点可靠性工程实践时,安东尼强调全面的监控和可观察性以及服务水平目标是至关重要的。他解释称,亚马逊云科技的Application Signals正在帮助他们更快地传递接力棒,因为它提供了建立目标和查看系统内部情况的原生支持。
在测试Application Signals时,摩根大通体验到了自动检测关键服务、操作和依赖项的过程。这使他们能够自动设置服务水平目标,并获得无缝的追踪集成,以及简化的诊断的统一视图。用安东尼的话来说,Application Signals正在帮助他们成为监控和可观察性的佼佼者。
他解释道,一旦提供了Application Signals,就会采用现成的云计算最佳实践,以帮助运营商高效地运行和监控服务。许多做法都与亚马逊云科技的构建者所遵循的做法相一致,以便可靠且经济高效地提供服务。"
Igor介绍了服务运营商在使用Application Signals时的三个主要入口点:
1. 服务级别目标 - 提供关键操作当前健康状况的可见性以及是否符合目标的合规性。根据超出错误预算的情况,揭示需要关注的事项。
2. 服务仪表板 - 提供所有服务和依赖关系的汇总视图,以识别缓慢或故障的组件。支持深入了解详细信息。
3. 服务图 - 可视化服务和依赖关系之间的架构和关系。允许检查行为随时间的变化情况。
在任何这些视图中检测到异常时,运营商可以深入详细的服务诊断,通过关联指标、轨迹、日志和事件来确定根本原因。
伊戈尔概述说,演示将模拟负责一个Java编写的宠物诊所应用程序并在[Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail)上部署的典型服务运营商的一天生活。该企业依赖于该应用程序来安排访问并接收新客户。
演示展示了运营商如何利用Application Signals来处理事故,检查依赖项,并识别异常的错误。
为了处理事故,服务级别目标和服务诊断仪表板迅速揭示了影响诸如安排访问和注册新客户等关键操作的可用性和延迟问题。
对于访问安排操作,在流量高峰期间,可用性从100%降至仅87%,违反了服务级别目标。通过点击异常并将其追溯至调用DynamoDB的具体失败,发现的是数据库容量不足的根本原因。
类似地,对于新客户注册,第99百分位数的延迟严重飙升至长达8秒,远高于2秒的目标SLO。追溯到一个特定的异常交易,揭示了配置错误的重试和在支付网关集成中的长时间等待。
在审查过程中,服务地图显示在添加新宠物时,新的SQS依赖项失败率为6%。操作员可以深入查看相关服务诊断,查找特定的清除队列操作错误,并查阅相关的跟踪和信息基础设施日志,以找出过度激进的队伍清除等问题。
为了识别诸如400状态码之类的异常错误,操作员可以利用服务行为和客户监控功能。点击与跨服务追踪相关的AJAX错误,可以快速定位错误的验证逻辑漏洞,例如提前30多天错误地阻止预约的情况。
在整个演示过程中,Igor强调了Application Signals如何关联遥测和基础设施,从高级指示器到粒度原因。他还展示了与亚马逊云科技管理控制台中的新我的应用视图集成,将可观察性信号与整体应用程序健康、成本、安全和交付管道联系起来。
在总结中,Igor概述了Application Signals如何提供经过验证的开箱即用的云原生可观察性最佳实践,以帮助操作员高效地监控和运营可靠的服务。演讲者鼓励与会者尝试使用Application Signals预览版并提供反馈给团队。
总的来说,这次信息丰富的会议提供了关于如何使用[Amazon CloudWatch](https://aws.amazon.com/cn/cloudwatch/?trk=cndc-detail) Application Signals来应对现代云应用程序监控的常见挑战的见解。演讲者通过生动的类比和实际示例有效地展示了Application Signals如何通过预建的仪表板、自动服务发现、黄金信号和相关遥测,提供直观的观察能力。
杰伊·佩雷·摩根大通的客户案例强调了Application Signals如何使他们能够自动设置服务水平目标,并对支持每天支付9-10万亿美元的系统的统一观测性有了了解。Igor的详细演示说明了操作员如何快速排查问题,如87%的可用性和8秒的延迟极端情况,以及通过6%的依赖失败率深入了解分布式应用程序。
与会者充分掌握了将这些云原生可观察性最佳实践应用于运行有弹性的、可扩展的应用程序的方法,从而为用户带来愉悦的体验。
**下面是一些演讲现场的精彩瞬间:**
领导者对过去飞行员在实时信号处理和安全飞行方面所面临的困境进行了反思。

如今,我们急需一种现代化的方法来监控应用程序,以便迅速发现和解决潜在问题。

领导者将管理复杂云应用程序的过程比喻成一场充满挑战的接力赛,要取得成功,诸多要素必须协调一致。

领导者强调摩根大通致力于客户服务的承诺,并将自己的技术专家视为可靠传递接力的田径明星。

通过服务仪表板,自动收集的黄金信号为我们提供了关于服务状况和相互依赖关系的一目了然的视图。

## 总结
Amazon Cloud Watch Application Signals是一项全新的应用性能监控功能,提供了预先构建的控制面板,以便轻松监控服务。它能够自动发现和跟踪服务的依赖关系,使运营人员无需花费大量时间和精力就能轻松获取全面的概况。此外,Application Signals还引入了服务级别目标,以协助评估性能指标。通过集成各种功能,相关指标、日志和基础架构变得简单易用。
主要特点包括:
1. Application Signals能够自动发现和追踪服务的依赖关系,并为运营人员提供一个预先构建的控制面板,展示关键指标如容量、延迟、错误和故障等。这样,运营人员无需手动进行设置便能一览无遗。
2. 服务级别目标有助于设定性能基准,并衡量服务离实现这些基准还有多远。这使得运营人员在发生严重问题之前就能够确定应采取哪些措施来解决问题。
3. 集成体验将指标、日志、基础架构以及其他数据整合在一起。这使得在调查问题时,可以从高级指标快速切换到详细的日志和基础架构信息。
总结:
Application Signals将云原生最佳实践应用于现代应用,从而提高了监控和故障排查能力。自动化发现、标准化指标、服务级别目标评估以及集成功能都是为了帮助运营人员构建更具弹性、高效且经济实惠的服务。
## 演讲原文
## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站!
[2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站")
[点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯!
[点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯!
## 即刻注册亚马逊云科技账户,开启云端之旅!
[【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“")
[【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")