使用 Amazon EKS 进行平台工程

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/CON311-Platform_engineering_with_Amazon_EKS-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 从最具创新性的初创公司到世界领先的企业,许多公司都在 [Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail) 上运行其内部平台,帮助他们加快开发人员速度并加快创新步伐。在本论坛中,了解亚马逊云科技多年,为帮助数千名客户在 [Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail) 上构建和扩展其内部平台而开发的最佳实践。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共1200字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 在亚马逊云科技的re:Invent上,三位演讲者——Kevin Coleman、Roland Barcia和Ahmed Bears——向观众介绍了他们在亚马逊云科技的工作经历。Kevin Coleman是亚马逊云科技全球Kubernetes市场团队的主要负责人,Roland Barcia是一位专注于容器和[无服务器](https://aws.amazon.com/cn/serverless/?trk=cndc-detail)解决方案的架构总监,Ahmed Bears来自纽约时报,负责领导他们基于亚马逊EKS的内部平台。 首先,Kevin Coleman通过投票了解了会议室中大多数人的身份,他们是平台工程师或领导公司平台的云计算采用举措的人。接着,他开始定义平台工程,解释它涉及到根据组织内部客户的需求定制计算抽象来识别和构建。目标是实现高效、低成本且可扩展的云计算采用,以加速软件交付。 平台团队构建这些抽象,以便允许应用程序团队将基础设施管理责任剥离出来,而专注于开发应用程序和满足最终客户的需求。然而,他注意到,根据应用程序团队的需求和组织限制的不同,提供的抽象类型和控制级别有很大的差异。有些团队比其他团队更想要控制基础设施。 为了说明抽象的价值,Kevin用一个发动机和汽车的类比来说明:虽然有些人能够从组件组装发动机,但更多的人只是想要在他们的汽车中安装一个完整的发动机,随时可以启动并驾驶离去。同样地,平台团队将基础设施组合成运行应用程序所需的完整抽象,使更多的软件开发者能够将基础设施复杂性从他们的任务中剥离出来。 除了基础设施抽象之外,Kevin还分享了一个关于内部平台的定义,包括API、工具、服务、知识和支持,作为一个有吸引力的内部产品。他强调了包含知识和支持元素的重要性,以及以产品为中心的思维模式。成功的EKS平台团队会以产品为主导的方式构建符合其内部客户需求的有吸引力的抽象。 Kevin总结道,投资于构建内部平台的三个主要好处包括:提高效率、降低成本以及加速软件交付。 通过消除每个应用程序团队提供自己的基础设施的需求并提供自助部署功能,公司可以加速从创意到生产的转换时间并减少新产品上市时间。平台抽象允许公司在所有运行在平台上的应用程序中以自动化方式强制执行安全、可靠性、可扩展性等方面的标准。工作负载受益于一致的政策和保护措施,而无需每个团队自己解决这些问题。 平台以多种方式节省成本——允许不同团队的工作负载在共享的基础设施上运行,通过集中专业知识减少人力资本成本,以及实现规模经济,其中添加新应用的边际成本随时间减少。 为了说明EKS客户如何实现这些好处,Kevin提供了两个成熟度不同的例子: Salesforce为其信任AI的Hyperforce平台提供了底层支持,该平台基于EKS上运行的Hyperforce Kubernetes平台。这提供了大规模的Kubernetes即服务,管理超过1000个集群和数百万个Pod。他们的平台工程投资使他们能够实现速度、治理和效率。 美国宇航局在全球科学家中构建了一个基于EKS的平台,以便他们轻松地配置环境以协作处理数据、分享过程并生成可重复的研究。虽然他们的旅程还处于早期阶段,但NASA的平台利用EKS支持开放和透明的科学研究。 为了过渡到最佳实践,Roland Barcia登上了舞台,讨论了从各种EKS客户那里看到的常见平台实施模式和教训。他指出,平台团队必须应对的基本紧张关系之一是治理和控制与开发者的自由和自主之间的平衡。开发者希望拥有最大的灵活性和最小的限制,而平台旨在为整个组织强制执行标准。 Roland概述了常见的困难领域: -所有权 -谁拥有和管理平台?将其视为具有客户的内部产品。 -抽象级别 -要提供多少基础设施控制给开发者?没有一个一劳永逸的模型。 -采用 -构建开发者想要使用的平台,并纳入他们的意见。 可观察性对于解决故障至关重要,它是影响开发者生产力的关键因素。隔离是根据需求和团队实现的工作负载之间的适当分离。他探讨了从完全的分布式控制(账户级别)到完全集中的控制(平台即服务)的各种实施选项。正确的方法取决于工作负载和使用情况的类型。罗兰强调,要从赞助的使用情况开始,选择满足当前业务需求的选项,并准备好随着时间的推移调整平衡。为了实现采用,需要将平台视为产品,包括收集开发者反馈、丰富文档、教育和支持。他指出,Kubernetes提供了用于配置和管理的API驱动方法,可以通过亚马逊云科技和开源工具如Argo CD、Flux和Crossplane来扩展。 最后,来自纽约时报的Ahmed Bears深入介绍了他们基于EKS的内部开发者平台。他概述了平台的核心理念——为工程师提供一致的体验、效率、可扩展性、集成和可见性。目标是让工程师能够在不关注基础设施管理的情况下无缝地开发和交付应用程序。 Ahmed解释说,他们围绕从创意到生产的开发者旅程设计了平台。他们的工作流自动执行云资源的开发生成、代码的构建/测试、CI/CD管道和服务到共享入口和可观察性的层。他强调,可观察性贯穿每个步骤,确保在追踪、日志和指标方面有遥测数据。 纽约时报的平台使用多账户架构在亚马逊云科技组织中,将中央平台和每个团队的账户分开,同时通过传输网关连接它们。他们在每个环境中使用EKS的多租户集群进行成本优化,并依赖OPA、Cilium和Carpet等工具进行安全和扩展。 在演示入门过程时,Ahmed展示了如何通过自动化的工作流程创建新账户、配置Terraform、连接到网络,然后将其与EKS集群链接。这些工作流程授予访问权限,并通过IAM角色和命名空间/政策来启用团队开始部署。该平台CLI和Backstage门户抽象了这些复杂性。 在总结部分,Ahmed分享了他此次旅程中所学到的宝贵经验。这些经验包括对文档和培训的重视、通过与合作伙伴的互动来实现迭代、将平台视为一个不断接收用户反馈的产品,以及对变化持有开放的态度。他强调,平台工程并非一次性的项目,而是一项需要不断发展以满足内部客户需求的工作。 本次会议详细介绍了亚马逊云科技团队及其客户在[Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail)上的平台工程策略。主要议题包括如何通过抽象化提高开发者的生产力、量身定制平台以满足特定需求、以开发者体验为核心推动采纳率,以及如何运用EKS及相关技术实现控制与敏捷性之间的平衡。与会者在离开时都对在Kubernetes上构建成功内部平台充满信心。 **下面是一些演讲现场的精彩瞬间:** 凯文·科尔曼(Kevin Coleman)和他的同事罗德尼·巴尔西亚(Roland Barcia)来自亚马逊云科技,作为顾客演讲者,他们与纽约时报的艾哈迈德·贝尔斯(Ahmed Bears)共同分享了他们的见解。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_0.png) 他们将探讨其团队在EKS平台上所采取的方法。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_1.png) 这位演讲者详细介绍了将在re:Invent上发表的演讲内容,包括关于利用EKS进行平台工程的看法、客户案例、实施模式和最佳实践,以及纽约时报的案例研究。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_2.png) 亚马逊云科技部门的领导们讨论了如何在亚马逊云科技基础设施服务上迁移、现代化和构建新应用程序,以支持组织在云中运行应用程序。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_3.png) 该领导人将去中心化和集中式基础设施管理进行了对比,强调了这两种方法对应用团队责任的影响。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_4.png) 该领导人还讨论了在搭建平台时需要面对的抉择——在多租户和单租户集群之间进行选择,并分析了每种方法的优缺点。 ![](https://d1trpeugzwbig5.cloudfront.net/CON311-Platform_engineering_with_Amazon_EKS/images/rebranded/CON311-Platform_engineering_with_Amazon_EKS_5.png) ## 总结 此次演讲探讨了公司在[Amazon EKS](https://aws.amazon.com/cn/eks/?trk=cndc-detail)上如何构建内部开发者平台,以加速云计算的采用。通过提供一个满足内部软件团队需求的基础设施抽象,这些团队可以专注于应用程序而无需关心基础设施管理。这样的平台带来了诸如提高速度、治理效率和效率等好处。 Salesforce和NASA在这方面的成熟度代表了两个极端。Salesforce在EKS上运行了一个名为Hyperforce的大型先进平台,推动了其向公共云的转变。而NASA则利用EKS让科学家们轻松地配置环境,以便在模型上进行合作。 常见的模式包括在集群、命名空间或帐户级别进行抽象。没有一种固定的方法。相反,需要根据内部客户的需求来反向推导。与初始工作负载的团队合作以推动采用。提供详细的文档和培训。根据反馈进行迭代。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭