使用 AI 和 Serverless 实现视频制作自动化

云计算

re:Invent

## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/BOA304-Using_AI_and_serverless_to_automate_video_production-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 AI 对于节省工作时间非常有用。在视频制作中，您可以使用 AI 工具来轻松添加配音、创建字幕以及制作视频描述和标题。但是，如果您想更进一步，自动化完成所有这些不同的任务，该怎么办呢？这就是 Amazon Step Functions 和 [Amazon EventBridge](https://aws.amazon.com/cn/eventbridge/?trk=cndc-detail) 等 Serverless 服务的用武之地。在本讲座中，您可学习如何使用 Amazon Step Fuctions 构建工作流和自动化不同的流程，以及如何使用 [Amazon EventBridge](https://aws.amazon.com/cn/eventbridge/?trk=cndc-detail) 处理实际情况。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华，共900字，阅读时间大约是4分钟。如果您想进一步了解演讲内容或者观看演讲全文，请观看演讲完整视频或者下面的演讲原文。</font> Max Vis Alva，一位拥有20年编程经验的开发者倡导者，在去年的生成性AI爆发之初，开始反思自己的职业生涯。随着文章中预测开发人员将过时，Max对她的未来感到担忧，并与同事探讨如何防止被AI取代。经过思考，她确定了两个关键的技能领域。第一个领域是开发者生产力工具，如亚马逊的AI编码伙伴CodeWhisperer。尽管Max自诩为经验丰富的程序员，但CodeWhisperer极大地提高了自己的工作效率。在过去，她在编程过程中经常陷入困境，需要通过搜索解决方案和观看不相关视频来分散注意力，然后在找不到解决方案的情况下耗费两小时。如今，有了CodeWhisperer在她的工作环境中提供相关解决方案的建议，她能够保持专注并解决问题。对于Mac用户，CodeWhisperer现在甚至可以在终端中提供建议，帮助开发者避免查阅文档。Max强调，即使是拥有超过20年经验的老练人员也能从AI增强的开发人员生产力工具中受益匪浅。第二个关键领域是构建AI驱动的应用程序的技能，包括调用各种AI服务端点。这些应用程序通常具备自然语言处理、推荐系统、语音合成等功能。然而，大部分开发人员并不想成为数据科学家或从头开始构建模型。幸运的是，AI领域提供了许多服务和API，使得在无专业知识的情况下整合AI成为可能。亚马逊云科技的用户已经使用了诸如Transcribe、Translate、Rekognition和Polly等服务。一些开发人员还与内部数据科学家合作，后者提供定制模型和端点。Bedrock通过其API轻松提供了200多个基本的AI模型。此外，还有许多第三方AI服务可供选择。Max鼓励开发人员将AI服务视为他们会集成的任何其他端点一样对待。调用端点是经典的开发者技能，仍具有效用。然而，一些AI端点，如大型语言模型，需要特殊的设计技巧来构建有效的提示并将它们正确地连接在一起。将不同的端点协调成一致的工作流程也是一个新的挑战。马克希亚通过展示三个示例来说明如何协调AI服务并使用事件将它们连接起来。首先，她的同事戴夫为孩子创建了一个睡前故事应用。每天晚上7点，该应用会根据孩子的兴趣使用AI生成新的插图故事。马克希亚详细解释了这种基于事件的[无服务器](https://aws.amazon.com/cn/serverless/?trk=cndc-detail)架构。调度服务启动一个Lambda函数，该函数调用Bedrock来生成故事文本。故事被保存在一个DynamoDB表中，然后触发一个变化数据捕获事件。Pipes将该事件路由到EventBridge。规则匹配该事件并调用目标，如SNS主题以发送电子邮件、用于使用Stable Diffusion生成图像的Lambda函数以及用于合成音频旁白的Polly。马克希亚强调，这种编排方式通过事件触发自主服务而非中央控制器，避免了紧密耦合。线性工作流完全由在系统中传播的事件驱动。在她的第二个演示中，马克希亚展示了一个自动化的视频配音系统，她搭建并用于翻译她自己的内容。它可以为上传到S3的视频的音频轨道进行配音、转录和翻译。她在AI驱动的自动化之间添加了手动验证步骤，以确保质量。起初她使用了调用各种API的Lambda函数，但后来将其重构为更容易监控和协调的Step Functions工作流。这些工作流协调Transcribe以生成字幕、Translate以翻译它们以及Polly以合成配音的语音。马克希亚解释了Step Functions如何通过将过程分解为离散步骤使调配更简单。它可以与超过220个亚马逊云科技服务和现在的HTTP端点集成。她还强调了诸如回调模式等有用功能，该模式可以在长达一年的时间内暂停工作流程以进行人工验证，以及用于基本数据处理的内在函数而无需Lambda函数。在她的第三个演示中，马克希亚展示了[无服务器](https://aws.amazon.com/cn/serverless/?trk=cndc-detail)之地，一个具有插件架构的视频流媒体应用。插件使用AI服务，如Rekognition和Bedrock，来进行转录、审核内容、生成标题和标签等。这展示了独立的微服务如何响应事件并共同构建复杂应用程序。总的来说，Marcia建议开发者满怀信心地采用AI服务，将其视为与其他任何端点相同的资源。通过使用Step Functions进行编排，可以有效地协调10个或更多的服务之间的工作流程。这种事件驱动的编排方式使得能够应对解耦的微服务之间的事件。她提倡使用Bedrock轻松访问生成式AI模型。保持解决方案简单且线性步骤在5个或更少，有助于提高可维护性。Marcia提供了许多代码示例和教程，以帮助开发者开始使用展示的服务构建应用。她的演讲向开发者展示了如何运用编排、事件和微服务等基本技能，同时把AI作为一个集成部分。通过使用适当的抽象和服务，开发者可以专注于构建应用程序而不是数据科学。协调AI服务以实现业务价值的可靠性是开发者的一个新挑战。Marcia的演示展示了如何通过[无服务器](https://aws.amazon.com/cn/serverless/?trk=cndc-detail)模式克服这个挑战，而不会增加复杂性。尽管AI功能在不断发展，但开发者可以通过将传统技能和最佳实践应用于明天的AI驱动应用程序来保持相关性。 **下面是一些演讲现场的精彩瞬间：** 领导者回顾了一年前的成果。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_0.png) 演讲者强调了一个好处，即在Bedrock控制台中使用场内迭代提示并调整推理配置后再发出API请求。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_1.png) 在调用模型以获取响应之前，请确保模型配置是正确的。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_2.png) 亚马逊云科技使用状态机来根据视频长度在Lambda和ECS之间智能路由视频处理。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_3.png) 通过使用诸如Step Functions之类的协调服务，可以将多个AI服务整合到端到端的AI应用程序中。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_4.png) 亚马逊云科技的领导者发布了一系列资源和代码，以帮助开发人员用他们喜欢的语言和基础设施实施新功能。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA304-Using_AI_and_serverless_to_automate_video_production/images/rebranded/BOA304-Using_AI_and_serverless_to_automate_video_production_5.png) ## 总结马克西·维斯·阿尔瓦在自动化视频制作工作流程方面展示了自己的技术能力。她向观众展示了一个基于事件驱动的"睡前故事"应用，该应用利用人工智能为儿童生成个性化的故事。这个应用程序通过协调Lambda函数、数据库和AI服务等操作，实现了事件和调度程序之间的协同作用。此外，马克西还介绍了一种自动化的视频配音管道。这种管道使用了Step Functions工作流来协调媒体处理的各个阶段，包括录音、翻译和文本到语音转换。这些工作流是由反应新媒体上传事件的EventBridge规则触发的。马克西建议将工作流分解成独立的状态机，而不是采用复杂的大型工作流。这样可以让新的步骤更容易地通过反应事件而非依赖复杂的任务标记来实现添加。最后，马克西强调了使用Step Functions等技术手段来协调调用多个AI服务的重要性。她还推荐使用Bedrock通过API访问AI模型。马克西总结道，开发者不应畏惧AI，而应通过将AI与传统代码相结合，并通过工作流和事件来充分利用AI的潜力。 ## 演讲原文 ## 想了解更多精彩完整内容吗？立即访问re:Invent 官网中文网站！ [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处")，一键获取亚马逊云科技全球最新产品/服务资讯！ [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处")，一键获取亚马逊云科技中国区最新产品/服务资讯！ ## 即刻注册亚马逊云科技账户，开启云端之旅！ [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家