生成式 AI：深度架构和应用程序

云计算

re:Invent

## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/BOA308-Generative_AI__Architectures_and_applications_in_depth-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读在快节奏的 AI 世界中，先进的生成式 AI 概念至关重要。为了保持竞争力和创新性，企业必须努力理解和实施复杂的方法。但由于这些讨论的初级阶段，明确和全面的资源可能很稀少，造成有效利用的困难。本论坛通过深入探讨这些新兴概念，解决这个问题。通过讨论实际应用并详细介绍实现最佳实践，本论坛提供了一个具体的理解，使企业能够在生成式 AI 中有效地使用这些前沿发展。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华，共1300字，阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文，请观看演讲完整视频或者下面的演讲原文。</font> 亚马逊云科技在2022年拉斯维加斯举行的re:Invent上举办了一场关于生成性AI的讨论。今年，共有500多名热情观众涌向充满活力的礼堂，期待着了解这一新兴技术的发展。作为亚马逊云科技的开发者倡导者，Mike Chambers和Tiffany Fong专门研究人工智能，他们对众多与会者在繁忙的re:Invent日程中抽出时间参加他们在广阔校园里的1小时讲座表示感激。 Mike指出，今年是会议上唯一一场专门讨论生成性AI的会议。考虑到近年来关于生成性AI的巨大关注和兴趣，他对这么多人在繁忙的re:Invent日程中抽出时间参加他们的讲座表示感谢。在舞台背景灯光明亮的背景下，Mike开始了互动式的观众调查问题：“您今天在工作负载或工作流中是否使用了生成性AI？”随着实时结果的出炉，Tiffany注意到有超过50%的人已经在他们的工作中使用了像ChatGPT这样的工具，用于生成代码片段或总结长文档等用途。Mike分享说，他本人定期使用生成性AI来创建演示文稿，发现它在制作内容方面非常有用。在设定好观众对生成性AI的熟悉程度后，Mike简要回顾了一下它的定义以及它独特的地方。简单来说，生成性AI是根据收到的提示生成全新的内容，而不仅仅是预测现有数据。如今，大多数生成性AI应用的基础是大型语言模型（LLM）。Mike解释了LLM是如何工作的——它们在大量的文本数据（通常是TB级别的数据）上进行训练，需要大量的计算资源。2017年的变革性的突破是变换器架构，使模型能够从数百万扩展到数十亿、甚至万亿的参数，这解锁了新的涌现能力。过去的AI模型仅限于单一任务，如翻译或摘要，而LLM可以通用，能够执行各种自然语言任务，如回答问题、生成代码或创建摘要。 Tifani指出，现有的语言模型（LLM）存在一定的局限性。由于它们在广泛的公共数据集上进行预训练，因此缺乏针对特定业务或领域的专有知识。它们的知识在训练过程中被固定，这可能导致在不谨慎设计提示的情况下产生误解或不准确的回应。为了克服这些限制，Mike深入研究了一种名为检索增强生成技术（RAG）的方法。RAG的核心思想是给LLM提供来自企业数据库或文档的相关数据，以扩展其输入，从而降低误解风险并提高准确性。这种方式并不依赖于LLM的预训练知识，而是利用外部数据源提供相关的事实以纳入输入中。尽管对LLM模型本身进行微调是另一种定制化方法，但与RAG相比，这需要更多的时间和数据。为了让这些概念更易于理解，Tifani用一个比喻来形容RAG：RAG就像给一个学习巫术的学生提供魔法书一样。LLM是带着广泛的知识离开魔法学校的毕业生。然而，要应对像打败巨魔这样的新挑战，学生需要参考包含21个特定咒语的魔法书。在RAG中，LLM是学生，而像公司数据库这样的数据源扮演着魔法书的角色。 Mike随后通过Python进行了实际代码演示，展示了RAG的应用。他首先将21个示例文本咒语通过一个句子嵌入模型转换为1000维的数值数组，这个数值表示被编码成一个简单的内存向量数据库。接下来，Mike将一个问题嵌入到相同的向量空间中。通过查询索引找到最相似的4个向量，系统从数据库中检索出最相关的文本片段。最后，将这些检索到的文本并入提供给名为Claude的这个LLM的输入中。经过这种增强的输入后，Claude能够生成一个量身定制的准确回应。 Tifani强调了这种方法与无法访问外部数据的标准LLM的不同之处。Mike还澄清说，向量化过程与LLM内部发生的事情是分开的。虽然外部数据要经过一个嵌入模型进行有效的相似性搜索，但检索到的文本作为原始文本被注入回输入中，供LLM处理。麦克介绍了代理的概念，这些代理本质上提供了API，使长短时记忆（LLM）不仅能够生成文本回应，还能采取行动。作为一个简单的例子，一个代理可以调用一个API来获取当前时间，而不是让LLM猜测时间。更先进的例子包括能够搜索零售网站并代表用户完成购买的代理。提法尼通过一个完整的架构展示了所有组件是如何组合在一起的。用户的查询被发送到代理，代理会询问LLM是否需要更多数据来形成回应。如果需要，代理会从向量数据库中检索相关信息，用这些数据扩充提示，然后将增强的提示馈送给LLM以生成准确的回应。麦克展示了亚马逊Bedrock如何在幕后无缝处理这些组件。控制台允许根据使用场景需求选择专门的基础模型，如多语言Jurassic、通用文本模型Claude或图像生成模型Stable Diffusion。数据源被摄入知识库中，自动处理向量化以便于高效检索。预构建的代理提供超过50个常见任务的API，例如与日历或云存储交互。在重点转移到安全性、审计和合规性等重要主题时，麦克幽默地戴上了一个笔袋和保护领带。他强调了了解生成AI系统不同组件（应用程序、数据源和LLM）之间流动的数据的确切内容的重要性。敏感数据可能暴露给LLM以允许其构造合适的查询。像任何其他接触敏感数据的组件一样，LLM周围的适当记录、治理和合规控制是必不可少的。提法尼概述了在高度监管的行业（如医疗保健和金融）中帮助满足这些要求的内置选项。S3和CloudWatch对LLM调用的日志记录提供了可能需要用于合规性的详细审计轨迹。PrivateLink支持私有连接，使得数据不会穿越公共互联网，这对于受监管的工作负载至关重要。在未来，Tiffany表示，随着生成性人工智能（AI）的不断发展，针对准确性和安全性方面的定制化将成为业界关注的焦点。Mike也认同这一点，他认为实验阶段的应用正在逐步转向实际生产环境。他预测，未来的模型将变得更加复杂，甚至会出现诸如视频和音频生成等新的应用领域。最令他兴奋的是，Mike认为生成性AI将通过经济高效地提取数据洞察，从而实现以往因技术复杂性而无法完成的项目。在总结中，Mike和Tiffany共同呈现了一场深入浅出、引人入胜的演讲，探讨了生成性AI的巨大潜力和负责任开发的重要性。一个小时的讲座通过流畅的概念整合、实时代码演示以及生动的案例讨论，成功地达到了其目标——深入介绍这一革命性技术的架构和应用。与会者们带着更加丰富的知识离开了会场，以便能够更好地推动生成性AI的合理应用并为实现美好未来做好准备。 **下面是一些演讲现场的精彩瞬间：** 领导者强调，生成式人工智能能够通过生成图像和文字等内容，展示出重要的技术进步。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_0.png) 他们指出，为了应对复杂问题和关注新兴领域，拥有适当的数据和工具至关重要。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_1.png) 领导者还探讨了如何将文本数据转化为嵌入空间，以便用于[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和深度学习。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_2.png) 演讲者展示了如何通过[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail)标准SDK界面调用AI模型，例如进行文本嵌入。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_3.png) 这个应用利用亚马逊云科技的服务来理解自然语言请求、查询数据源以及向用户提供自然语言回应。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_4.png) 亚马逊云科技提供了预先训练好的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型，使得从数据中提取价值变得简单且经济实惠。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA308-Generative_AI__Architectures_and_applications_in_depth/images/rebranded/BOA308-Generative_AI__Architectures_and_applications_in_depth_5.png) ## 总结生成性人工智能作为一项快速发展的技术，具有巨大的潜力。在这次深入剖析的演讲中，全面概述了其从基本概念到前沿应用的发展历程。演讲者首先阐述了大型语言模型如何成为生成性人工智能的核心。通过对大量数据集进行预训练，这些模型具备了诸如生成图像和文字，以及回答自然语言问题等各种能力。然而，它们的知识仍受限于训练数据。为了克服这些限制，研究人员采用了检索辅助生成和对话代理的方法。通过这些方法，它们可以为提示提供上下文，减少幻觉并准确地回答问题。演讲者还展示了用于操作向量数据库和提示的代码示例。类似亚马逊Bedrock的全托管服务自动化了整个流程。随着能力的提高，责任也随之增加。演讲者强调了在监管范围内保护生成性模型的重要性。日志记录、审计和专用端点有助于满足合规需求。展望未来，定制解决方案的使用将成为关键。这将使以前无法实现的项目得以实现，预示着一个充满希望的生成性人工智能的未来。然而，随着能力的增长，负责任的管理仍将至关重要。 ## 演讲原文 ## 想了解更多精彩完整内容吗？立即访问re:Invent 官网中文网站！ [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处")，一键获取亚马逊云科技全球最新产品/服务资讯！ [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处")，一键获取亚马逊云科技中国区最新产品/服务资讯！ ## 即刻注册亚马逊云科技账户，开启云端之旅！ [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家