「构」向云端征文大赛｜生成式 AI 产品体验：从 Amazon Bedrock 到 Amazon Q

机器学习

Amazon SageMaker

生成式人工智能

Amazon Bedrock

Amazon Q

### **#「构」向云端，构建者征文大赛#** > re:Invent 2023 带来的全新技术风向标。在本次大会期间，我们广下英雄帖，举行了「**构」向云端，构建者征文大赛**，邀请构建者们一同提笔畅想生成式 AI 与云碰撞的无限可能。本次赛事征集到了众多优秀分享，今天和大家一起分享其中一篇精选作品，让我们一起「构」向云端，感受技术的魅力！ ***本文作者小白要生发*** > 如果你也有如下问题，那么本文将会带你找到答案！ > > - 一套数据集，如何微调不同类型的开源大模型？—— [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) > - 如何只有产品说明书，如何构建一个智能问答机器人？—— [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) > - 哪里还有免费的 GPU 算力——在线 Jupyter 平台？—— [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 亚马逊云科技 re:lnvent 2023 上，介绍了一些云产品的升级，以及自研芯片的升级、性能提升。当然，2023 年的重头戏就是 AI，此次升级了 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 服务提供了更多功能，并推出了企业级 AI 助手——**[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail)**。对于 ML 研究者，升级后的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 提供了和 Jupyter 一致的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)（ML）环境。 ### AI 云服务此次发布会，我最关注的亚马逊云科技的 AI 服务，我发现它在这里做了非常多的差异化功能，这些功能是独具特色的： - 保护用户隐私、不会使用用户的数据来训练； - 支持定制化的模型数据； - 对 fine tunning 优化，不需要太多专业知识就能微调大模型； - 模型价格便宜，微调之后的模型成本有所提升，但依然比常见的某些 AI 服务便宜。在当前 AI 淘金潮中，亚马逊云科技在坚持做最好的“铲子”。 ### 面向开发者如何让普通 IT 人员也能上手 AI 产品？我作为后端研发，天天 CURD 做业务。对于 AI 大模型，只会用用聊天机器人、用文字描述生成图片。至于如何训练、调试大模型我是丈二和尚——摸不着头脑，大家都在聊“AI 赋能产品”，作为一名普通 IT 人员，当前只能“玩玩”它，至于产品赋能还把握不住。当前时间点，但凡一个降低 AI 使用门槛的工具开源，那都是 10k Star 级别的热度，例如： lang-chain, hinese-LLaMA-Alpaca, LLaMA-Factory 作为普通 IT 人员，我是非常愿意接触 AI 的。但目前开源 AI 产品对于我来讲，还是有非常高的使用门槛。现在就有很多云服务商就开始做人与 AI 算法产品之间的衔接工作。 ### Amazon Bedrock [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 提供一个简单的入口，让大家能够快速构建起生成式 AI 应用程序。它的能力有这几个方向： - 文本生成 - 聊天机器人 - 向量搜索 - 文本摘要 - 图像生成 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 采用了市面上优秀开源的模型，来完成如上工作。模型有： - Jurassic-2 - Claude - Command - Stable Diffusion - Llama 2 当然亚马逊云科技自己也研发了大模型——Amazon Titan。 ### 小试身手我们要试用大模型，还需要申请模型权限，其实就是勾选一下。 #### Chat 模型这里体验了一下 LLama 2 13B, 具体使用情况如下： ![640.gif](https://dev-media.amazoncloud.cn/0526c7ccd199424fb004f3fe2e5f2a3c_640.gif "640.gif") #### 文生图使用 SDXL 1.0 生成了一张 1024\*1024 图片，耗时 20s 左右。 ![640 (1).gif](https://dev-media.amazoncloud.cn/d49efad6f92946149df39fd04982b0bb_640%20%281%29.gif "640 (1).gif") 我又试用了一下亚马逊的 Titan Image G1 模型，同时生成了 3 张 1024\*1024 图，大概花了 30+s。 ![image.png](https://dev-media.amazoncloud.cn/ac500964e9574cdcb484ae69db00d597_image.png "image.png") ### 微调相较于我们平常用的通用模型，**亚马逊提供了可定制性、可微调、可以使用保存在云上语料库、知识库进行训练（fine tunning)**。也就是说，你可以通过使用大量的数据微调大模型，让模型学习到新的东西。再向模型提问时，就不需要提供冗长的上下文信息了，这样可以节约大量的 token，还能提高模型响应速度。 #### 创建 Fine-tunning 任务通过 Custom models 选择 Fine tuning job： ![image.png](https://dev-media.amazoncloud.cn/fa29090065784bbe8e988c9bcd880b3a_image.png "image.png") 微调任务，你只需要提交数据集即可，数据集的格式，你可参看这个文档： https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html?trk=cndc-detail ![image.png](https://dev-media.amazoncloud.cn/c1a40ebc0bd943e4af2dea5a5bd1a2fc_image.png "image.png") 这样就创建好微调模型任务了，这个模型就是为你定制的。要使用这个微调模型，还需要额外购买时间。如果你的用量大，微调模型的性能是能抹平这部分成本的。 ### 优势 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 提供一站式的多种开源大模型，以及配套的模型微调、dataset 预处理功能。在 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 你只需要熟悉一个模型的使用、调优、数据投喂功能，就能使用其他所有同类型模型了。如果是自己调适多个模型，那么不同模型的 dataset 格式、调优参数都是巨大的时间成本。在重度、商业化使用条件下，是占有成本、速度优势的。如果你有海量大模型使用请求，并且每次请求都要带上长长的上下文信息，那么不妨试试微调大模型。 ### 企业级 AI 助手——Amazon Q [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 是基于 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 构建一款完全托管的生成式 AI 驱动的企业聊天助手。最近登录亚马逊云科技后台时，我就发现 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 已实装到控制台了。是的，它的主要形态就是聊天助手。通过聊天的形式为你提供服务，就是 IM 客服。 ![image.png](https://dev-media.amazoncloud.cn/d18b36d6ece84663a213049eb17b5b9e_image.png "image.png") 借助 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 的能力，能够帮助普通用户快速了解亚马逊云服务，如果可能它还会提供对应的链接地址，大家点击就能跳转到对应的页面。让一般用户在没有专业的亚马逊技术售前的协助下，也能完成一些工作，这就是为 console 平台“增效”了。 ### 定制自己的 Q 亚马逊云科技控制台里的 Q，可以说是 Q 的最佳实践。接下来，我就带大家来定制一个 IM 技术客服。 #### 创建应用访问 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 控制台, 创建一个应用： ![image.png](https://dev-media.amazoncloud.cn/92047744ebfa43b68b852b562179cf50_image.png "image.png") 目前 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 还是预览版，没有全球发布，所以制定地区可用，这里选的弗吉尼亚。 #### 第一步：命名这里使用默认值，不用改，点下一步。授权可能会耽搁点时间，等一会儿就好。 ![image.png](https://dev-media.amazoncloud.cn/942d0b3dd3ad4531958d908043b45096_image.png "image.png") #### 第二步：Retriever 选择如果不清楚就直接选择 native retriever。 ![image.png](https://dev-media.amazoncloud.cn/e85baec761214005a32acd57cb0f987b_image.png "image.png") #### 第三步：数据源数据源空过，直接脱到底创建。 ![image.png](https://dev-media.amazoncloud.cn/9d4db6eeea5748619a31893f5f4db83d_image.png "image.png") ### 体验点击刚刚创建 Q application，进入到这个应用。 ![image.png](https://dev-media.amazoncloud.cn/a1ba883ee70142cdaa10a17c451d1ad2_image.png "image.png") #### 空白的体验点击 `review web experience` 就进入了一个聊天室。当前，我们还没有上传任何文档，也没有配置 retriever，我们问它几个问题试试。 ![image.png](https://dev-media.amazoncloud.cn/90f3937d5572468ca4043f562d5cf42a_image.png "image.png") 它会直接回复“没有数据源，不知道”。 #### 数据源添加回到我们的应用主页面，点击 `Add data source` ![image.png](https://dev-media.amazoncloud.cn/f6be2bc62b6b4d11b3b9e41b2c6148cf_image.png "image.png") 里我们选择上传文档，点击 `Upload docs` ![image.png](https://dev-media.amazoncloud.cn/db43e59e8c8443bd8f8d0d15dce81a9e_image.png "image.png") 关于数据源，我选择了 Codis 的文档。 ![image.png](https://dev-media.amazoncloud.cn/bc2561f56c1e45079cdde221aed5fde9_image.png "image.png") 上传文件, 它是支持 markdown 文件的，我就上传了 tutorial_en.md, FAQ_en.md 两个文件。 ![image.png](https://dev-media.amazoncloud.cn/0e3358fc99054262af3435ba55417858_image.png "image.png") #### 学习后的对话上传文档后，我们再来问问 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail)。可以看到它能根据我们提供的文档，进行回答了。 ![image.png](https://dev-media.amazoncloud.cn/f2b951483d034cf6bbc2d8b37942feeb_image.png "image.png") ![image.png](https://dev-media.amazoncloud.cn/6df2dba3bf964d078c96a92d958cd456_image.png "image.png") 后面还跟上了数据源，也就是它的回答依据是哪些文档。 #### 中文大家都看到了我一直都在使用的英文和它交流，因为目前的预览版对中文的支持还待优化，我这也上传了些中文文档，然后进行对话提问，结果如下： ![image.png](https://dev-media.amazoncloud.cn/289c14e05dec4347b8d0d0e95c778768_image.png "image.png") 还是比较期待它能完全支持中文，到时候就能赋能国内业务了。 ### 感受相比于其他 AI 产品，需要准备大量数据集，预训练，参数调优，以及服务部署，使用 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 时你只要投喂文档、数据给它，它就能成为某方面的专家，按照你的文档回答问题。你可以说它是一个更聪明的搜索引擎，或者智能客服。整个体验下来，我觉得不懂 IT 的朋友也能上手，目前亚马逊云科技对它的定义是——生成式 AI 驱动的企业聊天助手。从它的易上手程度、以及智能程度。我觉得它可以用作： - 个人知识库助手 - 企业知识库搜索入口 - 智能客服 - 售后技术顾问刚刚是在亚马逊的 Web 上体验了 Q，它当然提供了 API 供你介入自己应用内部。 #### 响应速度：10词/秒左右我在 Web 端体验是这样的速度。[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 是生成完所有文字后一次性返给前端，输出速度已经和人打字速度差不多了。 #### AI技术顾问就拿 AI 技术顾问为使用场景，我们把产品的使用文档，以及常见问题，以及解决方案投喂给 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail)，它就可以按照用户的提问，帮文档去查找解决方案，并告诉客户。是的，当你提供的云服务控制面板报错时，不需要让客户到处去查询“xx云平台报错该怎么办”了，这个时候，右下角弹出一个 Q ，咨询下客户遇到了什么问题，就能引导客户自行解决问题了。借助 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail)，可以做到 7*24 小时秒级支持我们的客户！对于一些专业、有一定使用门槛的产品，借助 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 是能够降低产品的使用难度，特别是在试用阶段，在新用户遇到困难并立马解决，是能提高成单率的。 #### 增效想象一下，你需要客服来解决售后问题，客服在客户和技术人员之间沟通解决问题，并把这些问题记录下来，逐渐积累了很多问题集——F&Q。慢慢地，客服反馈有些问题看看产品说明就能解决，但客户还是要打电话咨询。这个时候，你把这些售后问题投喂到 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 的 dataset，Q 就立马成为一名经验丰富的客户，能够帮客户解决一些常见问题了，解决不了的再接入到人工客服了。 ### Amazon SageMaker [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 提供专为数据科学家和开发人员高效地准备、构建、训练和部署高质量 ML 模型而构建的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)（ML）功能。当团队内的数据专家，想进一步对数据做分析时，无需把数据下载到本地，亚马逊提供了在线 Jupyter 平台，通过它你可以在任何终端访问 Notebook 进行数据分析工作，一切运算都在云端，数据通过 S3 访问，让你无需担心本地磁盘以及算力。 #### 创建 Notebook 访问 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail)，翻到 Notebook, 点击 `Create notbook instance` ![image.png](https://dev-media.amazoncloud.cn/4cebf28600ab4126b923e1a8d847bbf8_image.png "image.png") 这里填了的不用改，只需要填一下名字就行了。 ![image.png](https://dev-media.amazoncloud.cn/b4be1f566b914579ae83d3337db9e16b_image.png "image.png") #### 打开 Jupyter 创建好 notebook 实例后，点击 Open Jupyter 就能到一个你熟悉的界面了： ![image.png](https://dev-media.amazoncloud.cn/563e0aeb81d948779e8629480cdeea06_image.png "image.png") 是的，这就是亚马逊云科技提供服务的 Jupyter。你看到的 Running 状态，就是我没有关闭的实例。所以你不用时，记得手动关闭运行，因为它不会自己关，程序会一直为你保存工作状态，随时衔接工作。这样就不用写额外代码去保存中间状态了。 #### 访问 S3 数据那么如何访问 S3 数据呢？ ![image.png](https://dev-media.amazoncloud.cn/fc616fb711b0427589b04aaa215d7148_image.png "image.png") 通过如上代码，说明 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 是和 [Amazon S3](https://aws.amazon.com/cn/s3/?trk=cndc-detail) 打通了的。只需要配置好数据权限，数据分析人员就能自己拿数据进行分析工作了。 ### Amazon SageMaker Studio 对了，亚马逊云科技还推出了 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Studio 一个免费的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)（ML）开发环境。独立于亚马逊的账号体系，目前是需要申请的。不过我的申请一天就过了，还是挺快的。 ![image.png](https://dev-media.amazoncloud.cn/a8f3d66d9cd145168b733a1f2b73854d_image.png "image.png") 每天免费 4 个小时的 GPU 算力。如果你只用 CPU 的话，那么会有 8 个小时运行时可供你用。 ![image.png](https://dev-media.amazoncloud.cn/f8bb4cd3b546411eb923ed1e1b3785e0_image.png "image.png") 启动运行时之前，会让你填手机号，我填的国内的 +86 手机号，是可以畅通使用的。 ![image.png](https://dev-media.amazoncloud.cn/a8fbc90d829d4fc68b9f83f34ba058db_image.png "image.png") #### 访问速度目前，我访问 Studio 没有网络障碍，大家放心冲。 ### 生态这场 AI 热潮，亚马逊云科技不仅仅是提供了大模型给大家使用，还围绕达模型的训练、调优、运行提供了一整套服务。 ![image.png](https://dev-media.amazoncloud.cn/19ded1c5bc594d7e9db16584629dff2b_image.png "image.png") ### 安全作为云服务商，亚马逊非常重视用户的数据安全，并且公开承诺不会用客户的数据去改进他们的模型，至于他们怎么改进模型，估计是基于自己的业务。 ![640 (2).gif](https://dev-media.amazoncloud.cn/7d7b489b438647c581edb3ca14c6679b_640%20%282%29.gif "640 (2).gif") 还有生成的内容安全，由于 AI 生成模型参数众多，也许你都不知道训练出来的模型，可能学到了什么“坏毛病”。关于这些，[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 提供了跟踪，以及完善的日志功能，并且发现错误会帮你屏蔽内容输出，同时也会检查用户的输入。 ![image.png](https://dev-media.amazoncloud.cn/dc854ea3bc7a40c68ceb526789276155_image.png "image.png") 跑得快不一定赢，不跌跟头才是成功。在国内环境下，这些功能都是必须的，[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 已经先一步帮我们想到了。看过 re:Invent 2023 并体验过 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 之后，个人感觉距离 AI 产品更近一步了。在当前隐私泄露严重、滥用个人信息的环境下，生成式 AI 这个婴儿在一旁嗷嗷待哺（数据投喂），还有亚马逊云科技这样的云服务商把客户的安全、隐私放在第一位，是难能可贵的。 *（本文经过后期编辑整理后发布）* ### #欢迎观看更多精彩作品# 「构」向云端，构建者征文大赛现已评奖，欢迎大家扫描二维码或点击阅读原文，阅读更多精彩内容！ ![image.png](https://dev-media.amazoncloud.cn/1c307b8def1243868ff834783d1e9072_image.png "image.png") ![开发者尾巴.gif](https://dev-media.amazoncloud.cn/7a04979f261342388b2d16c36ca743e4_%E5%BC%80%E5%8F%91%E8%80%85%E5%B0%BE%E5%B7%B4.gif "开发者尾巴.gif")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家