云端运维之今天、明天与未来

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 多年来,亚马逊云科技不断创新其云端运营,支持自身的大规模需求,并为您开启这些功能,解决您在云端、本地、混合环境和边缘构建应用程序时在治理、合规性、可观察性和运营方面遇到的挑战。参加本论坛,您将了解亚马逊云科技云端运营如何通过自动化治理和智能、高效、基于应用程序的运营构建未来,为增长和创新提供动力。了解客户如何使用亚马逊云科技服务构建自己的云运营模式,以实现卓越运营,从而打破孤岛并优化成本。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共2500字,阅读时间大约是12分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 在2022年re:Invent的拉斯维加斯站上,亚马逊云科技的Nandini Ramani首次发表了关于云计算创新的演讲,吸引了超过500名观众。她表示,自2021年re:Invent以来,这一年充满了变革和创新。各行各业和不同地区的客户都在寻求亚马逊云科技的支持,以满足他们对于云技术的使用需求。据Nandini所说,亚马逊云科技将分享其在云计算运营方面的经验,展示诸如亚马逊云科技控制塔、CloudWatch、Config等服务的新功能,并阐述其未来的愿景——通过人工智能和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)实现云计算运营的优化。 亚马逊云科技认为,云计算运营对于实现运营卓越至关重要,主要包括两个方面。首先,需要为客户创建一个合规的环境,包括制定合适的边界、政策、流程和报告,以支持符合业务目标和合规需求的使用云技术。这将使组织能够节省时间、金钱,提高自动化合规性,并持续进行创新,而不必担忧云计算运营的问题。其次,需要对整体环境进行全面监控,涵盖账户、区域、云和基础设施等方面。这样可以让企业快速发现和解决问题,将平均解决问题的时间从数小时缩短至数分钟甚至数秒。全面的云计算运营可以为客户提供优秀的应用体验,同时为内部开发者提供更好的体验,使他们能够更快、更可靠地交付这些应用。 南迪尼表示,无论企业的规模如何,无论是大型全球企业还是小型初创公司,云操作都能帮助企业实现关键成果,例如自动化运营、提高弹性和合规性、增强开发者生产力以及维护治理。她曾进行了一次实时投票,调查观众他们的组织的主要目标是什么。结果显示,34%的观众选择了提高弹性和性能,紧随其后的是31%的选择自动化运营。南迪尼认为,这一结果可能与当天和当前的优先事项有关,但云操作确实可以帮助企业在云之旅中实现所有这些目标。 接下来,南迪尼解释道,亚马逊云科技相信通过客户的声音来讲述故事,而这些客户正是云操作挑战的直接体验者。她还介绍了一位来自摩根大通的桑迪,这家全球最大金融服务公司之一分享了他们如何利用亚马逊云科技来改变内部开发者体验并交付更好的应用程序。 桑迪指出,高效的云操作对于加速创新和提高应用的安全性、可靠性、可扩展性和成本效率至关重要。她简要介绍了摩根大通的业务情况,该公司拥有超过150年的为全球个人、企业和政府提供服务的经验,业务遍及100多个国家。他们拥有超过24万亿美元的托管资产,每天处理超过10万亿美元的支付,并提供从银行业务到投资银行的一系列金融服务。 桑迪解释说,摩根大通每年在技术上投入超过150亿美元,拥有超过35,000名软件工程师。他们拥有超过6亿行活跃代码,涵盖数千个应用程序,每天进行超过12万次构建,每月进行1亿次合成测试。除了巨大的规模外,他们还拥有一个高度复杂和多样化的生态系统。他们的应用程序组合使用各种语言,如Java、JavaScript和C++,横跨超过1500个微服务和框架,如React、Angular和Spring Boot,这些应用程序既可以在内部部署,也可以部署在公共云和私有云中。这些应用程序支持许多不同的业务功能,如交易、移动银行和贷款,同时还需要满足跨监管法规的独特合规需求。他们还维护着许多正在进行现代化的遗留主计算机应用程序。 据桑迪亚公司称,随着现代化的迅速推进,金融服务业面临的挑战日益严峻。作为一个高度受监管的行业,他们非常重视遵守各种法规,如GDPR和PCI。他们将这一过程比作在维修喷气式飞机的同时驾驶飞机,即在不影响客户的情况下实施现代化改革。 该公司强调,简化配置、可观察性、安全和合规等复杂任务是其业务创新的首要任务。为此,他们正在投资一流的云计算技术,如亚马逊云科技,以提供跨整个技术栈的实时洞察,以便进行前瞻性的监控、故障排除和优化。桑迪亚公司解释称,这些云操作能力需要嵌入基础设施和应用开发中,而不仅仅是IT运营。 然而,桑迪亚公司也指出,开发者在学习新技术的过程中可能会面临认知过载和上下文切换的问题。因此,从一开始就期望他们整合观测功能是不现实的。开发者应该专注于编写代码以实现业务价值,而不是担心基础设施管理。 为了解决这个问题,摩根大通创建了一个集中的自助服务云环境,其中包含预配置的工具、框架和云资源,以帮助开发者摆脱基础设施和合规细节的困扰。这些功能可以在开发者的IDE和门户中轻松访问。通过标准化的基础设施即代码模板和CI/CD管道模式,可以加速开发者的工作,从而纳入安全控制和最佳实践。这些模式将基础设施细节编码化,使开发者能够专注于应用程序代码。此外,通过将安全性和合规性提前考虑,可以实现更快速、更安全地将应用程序部署到生产环境中。 借助Honeycomb等观测工具以及CloudWatch Synthetics的可观察代码,可以在开发阶段就将观测提前。这将有助于在整个组织内推广最佳实践,惠及数千名开发者。桑迪亚公司分享了如何将交易系统等关键工作负载迁移到亚马逊云科技,从而提高了40%以上的性能和可靠性。桑迪亚公司期待亚马逊云科技带来更多的创新和云运营服务,以推动摩根大通的云转型。 南迪尼感谢桑迪亚分享了对摩根大通如何利用云计算推动创新和开发者赋能的深入见解。她强调了他们如何通过将基础设施视为代码并结合可观察性来将部署时间从数周缩短至数天,从而提升了客户体验。 接着,南迪尼阐述了亚马逊云科技如何帮助像摩根大通这样的客户在各个环境下实现这些成果。首先,她讨论了亚马逊云科技的Control Tower,这款产品可以在30分钟内创建一个符合最佳实践的安全多账户亚马逊云科技环境,并在各个账户和区域之间集中执行不断发展的治理边界,同时提供持续的合规监控。 南迪尼还介绍了一种全新的专注于数据驻留和数字主权的功能,这是专门为金融行业等受监管领域定制的。该功能提供了预定义和可自定义的控制选项,以及增强的区域拒绝能力,以满足通过精细访问限制、加密和高恢复力配置的数据驻留需求。 在可观察性方面,南迪尼描述了亚马逊云科技的CloudWatch和亚马逊云科技Config的作用,这两款产品每秒处理数百万个指标、事件、日志和配置更改,以监控亚马逊云科技和内部网络资源。CloudWatch仪表板提供了一个跨账户、地区和云环境的可视化统一视图。 南迪尼宣布CloudWatch现在支持查询和警报来自多个来源如OpenSearch和Azure Monitor的指标,这提供了一个统一的视图,减少了工具之间的重复指标。警报可以检测跨越数千台服务器的混合和多云环境中的问题。 为了采取行动,南迪尼解释了亚马逊云科技Systems Manager如何简化基础设施管理并自动化补丁等在包含数万台服务器的混合和多云环境中的变更。她宣布了一个新的视觉工作流编辑器,用于构建更快速的亚马逊云科技Systems Manager自动化运行书。 至于成本优化,南迪尼宣布了名为Infrequent Access的新型亚马逊云科技CloudWatch日志存储类,价格降低50%,非常适合不需要实时分析的日志。对于亚马逊云科技Config,推出了定期的资源配置捕获,可以减少追踪的变化量达90%,从而降低成本以适应法规。 最终,Nandini表示,作为默认设置,亚马逊云科技将为所有账户和区域启用Application标签。这将使得使用Cost Explorer按照应用追踪成本以及通过Security Hub跨数千个资源查看应用的安全状况成为可能。 Nandini解释道,[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和人工智能在未来将帮助我们自动化更多任务并为我们提供前瞻性的见解。她邀请了亚马逊云科技的高级首席工程师David Janacek来展示如何利用生成性AI和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)的新功能。 David首先提到了在科幻作品中与计算机进行自然对话是多么容易获取答案。他将这与在Amazon工作了17年的复杂操作工具如CloudWatch的专家使用进行了对比。尽管David在Amazon有丰富的经验,他仍然有时会忘记CloudWatch日志洞察查询的细微之处,不得不查阅文档。他希望有一个电脑助手能以普通英语回答自然问题来帮助他找到正确的数据访问方法。 David演示了一个虚构的故障排除场景,从CloudWatch警报开始,指示应用程序可用性降低。他展示了如何通过扫描原始日志来查找紧急情况,但并没有发现有用的模式。David用特定请求ID过滤日志的问题向自然语言查询能力提问,它根据他的对话生成了正确的CloudWatch日志洞察查询。 接下来, David想要进一步分析日志, 绘制应用程序错误数量随时间的变化图。他用普通语言询问错误每分钟有多少,虽然他没有确切地知道语法。自然语言引擎生成了合适的聚合查询,创建了一个时间序列可视化。 现在有了一个高层次的视图,David希望“增强”嘈杂日志中的信号,以总结常见的模式和趋势。他只是问系统能否对日志进行摘要。在幕后,它使用了基于[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)的CloudWatch日志异常检测新功能来分析模式。这将从数千条独特的日志行中提取出少数常见模式。 大卫向众人展示了一种系统,用于检测和解析已标记的模式。这使得他在不筛选原始日志的情况下,就能了解应用程序的运行状况。通过对警报前后的数据进行比较,他迅速找出了问题的根源——流量增长超过了预先分配的数据库容量的50%以上。为了避免类似的问题再次发生,大卫将出问题的DynamoDB表切换到了按需自动扩展容量。随后,他利用亚马逊云科技的Config功能中的自然语言查询生成功能,寻找其他应调整为按需模式的DynamoDB表。这样,他能够轻松地搜索资源,并在整个组织中推广最佳实践。 南迪尼强调了大卫是如何通过对话式提问而非回顾查询语言来解决问题的。这些演示利用了基于生成性人工智能的CloudWatch和Config的新自然语言界面,以简化故障排除和云资源的搜索。她重申了这些创新旨在实现更多的任务自动化并提供更前瞻性的洞察。南迪尼对AI、量子计算和扩展现实的未来潜力感到兴奋。 接着,南迪尼邀请了来自迪士尼公司的阿列克谢,世界上最具知名度的媒体和娱乐公司之一,分享了他们如何优化其多元化的电影主题公园业务的云运营。阿列克谢首先描述了支持迪士尼各个品牌、业务部门和地区的数千个工程团队所面临的挑战。他们的目标是为客户提供一致的云服务灵活性,同时保证治理。最初,由于跨团队的流程问题,建立新的亚马逊云科技账户需要几天的时间。因此,他们设立了一个专注于自动化和自助服务的中央云计算卓越中心,以在分钟内完成账户配置,将设置时间缩短超过90%。云计算卓越中心还负责维护与迪士尼的安全和合规政策相一致的基础设施即代码模板。这些模板被应用到新账户和服务上,以加速团队的速度,同时确保治理。 亚历克西解释了他们如何构建了一个名为任务控制的平台,该平台在亚马逊云科技上提供了对跨账户和区域的应用和基础设施监控数据的轻松访问。这个统一视图使得工程师可以通过CloudWatch仪表板搜索日志、可视化指标和设置警报,从而提高了迪士尼全球服务的异常检测和恢复时间超过40%。 在成本优化方面,亚历克西讨论了如何将大量细粒度的亚马逊云科技成本和使用情况数据导入[Amazon Redshift](https://aws.amazon.com/cn/redshift/?trk=cndc-detail)的问题。为了避免碎片化的体验,他们集中了数据并创建了一个共享Redshift查询最佳实践的社区。通过自定义报告和自助服务访问,可以更快地应对优化机会,从而节省数百万的成本。 亚历克西提到,云转型之旅是持续不断的。他们正在使用第三代云操作平台,不断改进以利用像亚马逊云科技配置规则这样的功能来提供更多价值。他期待着新的亚马逊云科技功能,如控制塔账户计分卡,以便团队可以轻松查看其云资源的风险、可靠性和成本。亚历克西强调说,要从内部客户需求出发,而不是从解决方案开始。 南迪尼感谢亚历克西分享了迪士尼的见解,展示了云计算能力如何帮助他们快速创新,同时保持治理和控制。她观察到两个客户故事都强调了关键关注领域——安全、可靠性、开发者生产力、治理和成本优化。亚马逊云科技的集成云运营服务,如控制塔、CloudWatch和Config,允许公司通过消除无差异的重体力工作,专注于业务创新。 南迪尼重申,我们仍处于云运营马拉松的早期阶段,还有很多机会。她想象着一个自动化的未来,其中大部分任务都是自主优化、自主配置和自我修复,无需人工故障排除。AI服务可以快速确定根本原因并自动修复问题。这将使工程师能够专注于不同的功能和业务创新。 总的来说,Nandini对亚马逊云科技在客户合作下将云计算运营提升到新的高度表示兴奋。在未来,我们将实现简单、无缝的云计算运营,从而实现快速且高效的检测与决策。她鼓励与会者充分利用展示的众多相关会议和新功能,继续他们在云计算运营领域的探索。最后,Nandini感谢了演讲的客户和工程师,以及参加首届云计算运营未来会议的观众们。 **下面是一些演讲现场的精彩瞬间:** 控制台生成了适当的CloudWatch查询,以回应关于生成性AI的开放式问题,并通过逐步解释引导用户。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_0.png) 领导者讨论了科幻小说中如何使用计算机来清除噪音信号,正如现实中的亚马逊云科技服务可以帮助解读混乱的数据一样。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_1.png) 该工具通过对比当前和之前的状态提供实时洞察,揭示错误的原因,即未充分使用的DynamoDB吞吐量。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_2.png) 领导者强调了亚马逊云科技如何帮助企业在技术迅速变革的时期做出明智的决策。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_3.png) David在亚马逊云科技re:Invent上的演示受到了赞誉。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_4.png) 领导者想象了一个简单、无缝的云计算未来,客户可以快速做出决策。 ![](https://d1trpeugzwbig5.cloudfront.net/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond/images/rebranded/COP227-INT-Cloud_operations_for_today__tomorrow__and_beyond_5.png) ## 总结 在re:Invent上的一场演讲中,主要探讨了云计算运营的相关议题,包括当前和未来趋势。演讲的主题集中在如何通过自动化、人工智能(AI)以及各种服务如CloudWatch、Config和控制塔等新功能的应用,来实现云计算运营的简化和创新。 亚马逊云科技认为,云计算运营有两大关键要素:治理和行动的可观察性。针对治理方面,控制塔有助于创建安全的多账户环境并确保其合规性。此外,新功能还增强了数据居留地的控制能力。在可观察性方面,CloudWatch提供了一种跨混合环境的统一视角,而新的低成本日志存储类别有助于降低运营成本。Systems Manager的自动化可视化编辑器简化了创建工作流程的过程。Config的定期录制功能则通过捕捉更少的配置更改来降低成本。 展望未来,人工智能和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)将进一步推动云计算运营的简化。演示过程中展示了一些例子,如在CloudWatch日志中使用自然语言查询来查找答案而不需要了解语法的细节。此外,异常检测能够总结随时间变化的日志模式。甚至可以通过简单的英语问题生成Config查询。 亚马逊云科技的愿景是建立一个更多具有自我优化和自我修复能力的系统,从而减少人工干预。公司将不断推动创新,使得云计算运营变得更加无缝、简单和高效。最终目标是为团队创造一个专注于创新和价值创造的环境。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭