Amazon SageMaker Canvas 新功能——使用自然语言探索和数据准备

机器学习
re:Invent
Amazon Bedrock
0
0
今天,我很高兴地向大家介绍 [Amazon SageMaker Canvas](https://aws.amazon.com/cn/sagemaker/canvas/?trk=cndc-detail) 的新功能——使用自然语言指令来探索、可视化和转换[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)( ML )数据。 SageMaker Canvas 现在支持使用基础模型( FM )提供的自然语言指令补充其全面的数据准备功能,用于数据探索、分析、可视化和转换。通过使用自然语言指令,您现在可以探索和转换数据,从而构建高度准确的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型。这项新功能由 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 提供支持。 数据是有效[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)的基础,将原始数据进行转换以适应[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型构建和生成预测结果是获得更好洞察力的关键。分析、转换和准备数据以建立[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型通常是[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)工作流程中很耗时的部分。借助 SageMaker Canvas ,在不编写任何代码的情况下,使用 300 多种内置的转换和分析功能以及深入的数据质量洞察报告,实现了无缝快速的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)数据准备。从今天开始,在 SageMaker Canvas 中使用自然语言指令进行数据探索、可视化和转换,数据探索和准备的过程更快捷、更简单。 现在,使用查询和响应的自然语言体验加快了数据准备任务。您可以通过上下文引导式提示快速入门,了解和探索您的数据。 假设我想使用 SageMaker Canvas 构建一个预测房价的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型。首先,我需要准备住房数据集来构建一个准确的模型。为了开始使用新的自然语言指令,我打开 SageMaker Canvas 应用程序,并在左侧导航窗格中选择 Data Wrangler 。在 Data 选项卡下,从可用数据集列表中,选择 canvas-housing-sample.csv 作为数据集,然后选择 Create a data flow 并选择 Create 。我看到了我的数据集表格视图,以及关于新功能 Chat for data prep的介绍。 ![屏幕截图 2023-12-26 194214.png](https://dev-media.amazoncloud.cn/14b8df73d2814300a57db37bd948e7c6_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194214.png "屏幕截图 2023-12-26 194214.png") 我选择 Chat for data prep ,会显示聊天界面,其中包含一组与我的数据集相关的引导提示。我可以使用其中任何一个提示,也可以利用数据查询其他信息。 ![屏幕截图 2023-12-26 194445.png](https://dev-media.amazoncloud.cn/6ca9ddf32bde4ab9be7b82297b8f122e_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194445.png "屏幕截图 2023-12-26 194445.png") 首先,我想了解我的数据集质量,以便识别任何异常值或异常。我请求 SageMaker Canvas 生成一份数据质量报告来完成这项任务。 ![屏幕截图 2023-12-26 194509.png](https://dev-media.amazoncloud.cn/a557fcd5fec748319698e7763652d71b_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194509.png "屏幕截图 2023-12-26 194509.png") 我发现我的数据没有大问题。现在我想可视化数据中几个特征的分布。所以,我请 SageMaker Canvas 绘制一张图表。 ![屏幕截图 2023-12-26 194625.png](https://dev-media.amazoncloud.cn/c9e8812a796f403a974d49b71ceb0c03_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194625.png "屏幕截图 2023-12-26 194625.png") 现在我想筛选某些行来转换我的数据。我请 SageMaker Canvas 删除人口少于 1000 的行。 Canvas 删除了这些行,显示了转换后的数据预览,并提供了选项,用于查看和更新生成转换的代码。 ![屏幕截图 2023-12-26 194641.png](https://dev-media.amazoncloud.cn/1ebf73ad09ff4e1abf63212d45870bd9_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194641.png "屏幕截图 2023-12-26 194641.png") 我对预览很满意,并将转换后的数据添加到右侧的数据转换步骤列表中。 SageMaker Canvas 在操作中添加了步骤和相应的代码。 ![屏幕截图 2023-12-26 194705.png](https://dev-media.amazoncloud.cn/b93723826e6a4eb88cf186a809be55a5_%E5%B1%8F%E5%B9%95%E6%88%AA%E5%9B%BE%202023-12-26%20194705.png "屏幕截图 2023-12-26 194705.png") 现在我的数据已经转换完毕,我可以继续构建我的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型来预测房价,甚至可以在无需编写任何代码的情况下,使用 SageMaker Canvas 同样的可视化界面将模型部署到生产环境中。 对于[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)来说,数据准备从未如此简单! ##### 可用性 在所有支持 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Canvas 和 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 的亚马逊云科技区域中,在 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Canvas 中使用自然语言查询探索和转换数据的新功能已经发布上线。 ##### 了解更多信息 [Amazon SageMaker Canvas](https://aws.amazon.com/cn/sagemaker/canvas/?trk=cndc-detail) 产品页面 立即开始构建! 【文章来源: https://aws.amazon.com/blogs/aws/use-natural-language-to-explore-and-prepare-data-with-a-new-capability-of-amazon-sagemaker-canvas?trk=cndc-detail/】 — Irshad
0
目录
关闭