利用机器学习和向量数据库进行高级 AI 搜索

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 随着 AI 不断改变行业,生成式 AI 和大语言模型的应用变得越来越重要。本论坛深入探讨了这些模型在从时尚到娱乐,从化学信息学到生物信息学的各个领域的应用程序。它演示了如何通过开发产品目录相似性搜索解决方案、集成[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)技术和 PostgreSQL 的向量数据库,构建类似的解决方案。了解如何使用 PostgreSQL 的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和向量数据库,创建搜索解决方案,以增强亚马逊云科技上各个部门的用户体验和改进结果。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共900字,阅读时间大约是4分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 苏曼·德夫,作为亚马逊云科技的首席数据和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)开发者倡导者,在亚马逊科技峰会上发表了演讲。他强调,生成性人工智能已成为一个热门话题。事实上,在最近一次乘坐Lyft出租车前往会议的途中,他的司机询问他的演讲是否涉及[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和人工智能。这个轶事突显了人们对新型生成性人工智能功能的兴奋和兴趣。 然而,苏曼接着指出,尽管像GPT-3这样强大的大型语言模型可以生成新内容并在几乎所有话题上进行令人信服的对话,但它们缺乏针对特定领域或专业问题的定制能力。为了说明这一限制,他向大约30名与会者进行了一次投票,询问一个通用预训练模型是否能回答关于过去15天内某个特定电子商务平台上哪些产品收到了最佳评价的问题。所有30名与会者都正确地回答,今天的大型语言模型无法回答这样的专门、时间敏感的问题。 苏曼简要介绍了一些背景信息,即亚马逊在过去20多年里积极开发和部署[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail),以驱动众多产品和服务。例如,推荐算法利用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)为客户推荐新产品。搜索相关性[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型确定最佳的搜索结果。仓库机器人利用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)进行高效的路径规划。Alexa的自然语言能力是由超过30个不同的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型支持的。 然而,他解释说,这些模型都是根据亚马逊专属的大型数据集(通常有数PB大小)进行训练的,专注于特定的领域,如搜索或推荐。相比之下,今天的大型语言模型,如GPT-3,是在互联网上从各种来源的通用数据中进行训练的,这使它们能够广泛地交流,但没有专门的知识。这些模型在几个月的高强度计算时间内,通过在整个互联网上训练而学会了数百亿个参数。 然后,苏曼概述了三种主要技巧,用于调整大型语言模型并进行定制:微调、从头开始预训练和信息检索增强。 微调是一种在现有预训练模型的基础上,针对特定新领域数据进行训练的方法,仅涉及最后几层(可能是整个模型参数的5%)。这种方法使模型能够适应新的术语和主题,同时充分利用预训练过程中所学到的所有知识。然而,与从头开始重新训练整个模型相比,微调在资源和时间方面的需求要小得多。 预训练是指在数十亿个参数的整个模型上,从基础开始使用自定义数据集进行训练。虽然这允许对新领域进行完美定制,但它需要大量的数据量和技术公司能调动的大规模计算资源。 作为一种替代方案,信息检索增强通过将领域特定的数据存储在向量数据库中,避免了大量重新训练的过程。在查询时,首先查询此数据库以检索与大型语言模型的上下文最相关的信息。这种技术的关键优势在于能够在不重新执行整个训练过程的情况下对模型进行定制和专门化以适应新领域。 Suman解释了如何将文本、图像和音频等数据转换为捕捉语义意义的向量。使用欧几里得距离和余弦相似性等向量相似性计算,可以从响应于任何查询的数据库中检索最相关的向量。这些向量提供了与原始查询一起传递的上下文信息。 为了在云端构建这些向量数据库,Suman强调了亚马逊云科技的一些服务。[Amazon Kendra](https://aws.amazon.com/cn/kendra/?trk=cndc-detail)提供无需执行自定义向量化功能的即开式语义搜索功能。Amazon OpenSearch可以用于通过使用开源工具构建自定义向量数据库。Aurora PostgreSQL可以通过使用pg_vector扩展来将向量存储和相似性搜索添加到标准关系数据库中。 开源的LangChain框架整合了各种用于信息检索增强的组件,包括向量数据库、大型语言模型和应用代码。Suman通过一个简历筛选的应用程序示例展示了LangChain的实际效果,将简历作为1556维度的向量存储在Aurora中。他的应用程序随后通过查询与职位描述相似的向量来查找最适合该职位的候选人,然后再使用[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail)对最佳匹配进行总结。 总之,Suman强调了信息检索如何轻松地将专业领域知识融入大型语言模型中,而无需重新训练。通过结合向量相似性搜索和生成性AI的优势,可以在亚马逊云科技上利用如Aurora、Kendra和Bedrock等服务构建创新的新智能应用。尽管大型预训练模型具有令人惊叹的通用性,但信息检索使客户能够将这些模型应用于自己的特定用例和业务领域。 总的来说,Suman的有趣演讲为与会者提供了一个关于定制和应用生成性AI的综合且易于理解的技巧概述。他成功地将清晰的解释、具体的例子和一个引人入胜的简历筛选演示相结合,展示了如何在实际场景中使用向量搜索使生成性模型更有用。观众可能在离开时能更好地理解如何运用这些技术在自己的组织中发挥其作用。 **下面是一些演讲现场的精彩瞬间:** 亚马逊云科技旗下的Bedrock能够在不改变底层基础设施的前提下,无缝整合各种AI模型。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_0.png) 近日,该公司推出了一款全新的向量数据库服务,旨在方便用户从亚马逊云科技获取信息。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_1.png) 此外,他们还推出了[Amazon Kendra](https://aws.amazon.com/cn/kendra/?trk=cndc-detail),这是一款无需编程的向量数据库服务,能够内置处理嵌入式表示。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_2.png) 对于需要强大关系型数据库的用户,Aurora和RDS for PostgreSQL是一个不错的选择,该数据库拥有庞大的开源社区支持。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_3.png) 系统领导者们通过使用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型将简历文本进行嵌入向量,实现了语义搜索且不会丢失信息。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_4.png) 最后,演讲者们展示了一个AI食谱生成器,该生成器可以根据输入的食材为用户提供食谱建议,展示了亚马逊云科技服务在开发者领域的无限可能。 ![](https://d1trpeugzwbig5.cloudfront.net/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search/images/rebranded/BOA312-Utilizing_machine_learning___vector_databases_for_advanced_AI_search_5.png) ## 总结 本次演讲的主题是关于如何将向量数据库与大型语言模型相结合,以便构建更智能的应用程序。演讲者指出,尽管诸如生成性AI等大型语言模型能够回答许多问题,但它们往往缺乏对特定领域知识的理解。" "首先,关键之处在于,向量数据库能够将自定义数据作为嵌入进行存储。这些向量以数学方式表达了文本、图像等内容。这使得语义搜索能够找到相关联的向量。演讲者展示了如何通过查询向量数据库来检索相似向量的过程。" "其次,利用诸如LangChain之类的框架进行检索增强生成是另一个关键要点。向量数据库会为查询提供相关的上下文信息。这种上下文可以帮助语言模型生成更有用的回应。演讲者用一个筛选简历的例子进行了说明——从向量数据库中检索相似的候选人,然后使用语言模型对他们的信息进行概括。" "最后,将向量数据库与大型语言模型相结合可以使AI应用程序更好地理解和处理特定领域的数据。演讲者强调了使用亚马逊云科技服务,如[Amazon Kendra](https://aws.amazon.com/cn/kendra/?trk=cndc-detail)、OpenSearch和Aurora作为向量存储,以及用于语言模型的[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail)的重要性。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭