> 作者 | 凌敏、王一鹏
在今天,人工智能早已从一项前沿技术转变为企业运营的核心能力,加速渗透到各个场景中。与之相应的是,AI 模型开发部署以及数据管理的复杂性问题日渐突出,高昂的算力成本和资源利用率不足,甚至是 AI 专业人才短缺,这些都变成了 AI 应用爆发道路上的屏障。
云厂商对此的感知或许更为敏锐——他们通常会在一年里接到不同客户的大量需求和产品建议。
也是因此,在今年 re:Invent 的第三日发布上,亚马逊云科技从三大维度构建了 AI 解决方案。
在最底层,[Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 已经进化成为“新物种”,进一步帮助企业降低模型训练成本,提高算力利用率;在中间层,[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) Marketplace 的开放程度“超级加倍”,从模型“自营店”升级成模型“百货商场”,并通过多项能力降低生成式 AI 开发门槛;在最顶层,[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 发布多项升级,提升代码开发效率,并与 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 形成联动,增强模型构建与数据处理能力。
亚马逊云科技的理念是:新产品与技术的更新不应是“拿着锤子找钉子”,而是去繁就简,实用至上。
### Amazon SageMaker 进化成为“新物种”
亚马逊云科技的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)服务 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 自 2017 年问世以来,功能不断扩展,在今年,[Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 再度进化,为所有数据分析和AI提供一站式服务,分析工作化繁为简,重新定义生成式 AI 游戏规则。
全新的下一代 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 几乎涵盖包括数据探索、准备与集成、大数据处理、快速 SQL 分析、[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型开发与训练,以及生成式 AI 应用程序开发所需要的全部组件。
*(注:原 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 现已更名为 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) AI,被集成在下一代 SageMaker 当中,同时也作为独立服务开放,主要面向希望专注于大规模构建、训练和部署 AI/ [机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型的用户。)*
如果说去年推出的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) HyperPod 是助力用户实现分布式训练的绝佳工具,那今年新发布的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) HyperPod flexible training plans 则能充分利用云端峰谷资源来节约训练时间和降低成本。
后者的原理比较简单——它允许用户根据自己的时间和预算灵活地训练生成式 AI 模型,并为用户提供一份模型训练时间预测表。当用户创建并购买训练计划后,Amazon SageMaker 将自动配置所需基础设施,并在这些资源上执行训练任务,无需人工介入。Amazon SageMaker 还能自动管理在计算资源切换时的训练暂停和恢复工作。
在行业内,大模型训练一次长达几周至数月,所以开发者真正需要的,其实不是太花哨的技术理念,而是一份明确的、可控的时间表和托管系统。这是 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) HyperPod flexible training plans 引人关注的原因所在。
至于同场发布的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Unified Studio(预览版),则是一套独立的数据与 AI 开发环境,旨在加快团队协作与生成式 AI 应用构建节奏。
它整合了亚马逊云科技目前在 [Amazon Athena](https: //aws.amazon.com/cn/athena/?trk=cndc-detail)、[Amazon EMR](https://aws.amazon.com/cn/emr/?trk=cndc-detail)、Amazon Glue、[Amazon Redshift](https://aws.amazon.com/cn/redshift/?trk=cndc-detail)、[Amazon Managed Workflows for Apache Airflow](https://aws.amazon.com/cn/managed-workflows-for-apache-airflow/?trk=cndc-detail) (MWAA) 以及现有 Amazon SageMaker Studio 中建立的一系列独立“工作室”、查询编辑器及可视化工具的功能和资源。
借助 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Unified Studio 中的 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 集成开发环境(IDE),用户可以使用 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 精选的高性能基础模型及工具(例如 Agents、Guardrails、Knowledge Bases 以及 Flows),快速高效地构建并部署生成式 AI 应用程序。
此外,Amazon SageMaker Unified Studio 还内置有数据发现、共享和治理功能,确保分析师、数据科学家和工程师们得以轻松搜索并找到当前用例所需要的正确数据,同时应用必要的安全控制与权限、实施访问控制以保护业务数据。
另一重磅更新来自 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Lakehouse。
随着数字化转型进入深水区,企业对数据的需求也有了新的变化。[Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Lakehouse 通过提供对存储在 [Amazon S3](https://aws.amazon.com/cn/s3/?trk=cndc-detail) 数据湖、Redshift 数据仓库以及其他联合数据源中的数据的统一访问,进一步降低了数据查询的门槛。它全面兼容不同形式、不同物理存储位置的数据资源,为客户提供了一种简单的方法来统一分散在多个数据湖和数据仓库中的数据,从而打破数据孤岛。
借助与 Apache Iceberg 兼容的 Amazon SageMaker Lakehouse,企业可以通过 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Unified Studio 访问并处理所有数据,同时使用他们熟悉的 AI 和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)工具以及与 Apache Iceberg 开放标准相兼容的查询引擎。这意味着,企业能够使用自己选择的分析和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)工具进行数据处理,全面适配不同形式、不同物理存储位置的数据资源,支持包括 SQL 分析、即席查询、数据科学、[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)与生成式 AI 在内的各种用例。
此外,Amazon SageMaker Lakehouse 还提供了集成化的细粒度访问控制,这些控制将一起应用于 Lakehouse 中的全部分析及 AI 工具数据。并允许企业一次定义权限,即可在整个组织内实现数据共享。
在数据和 AI 治理方面,下一代 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 简化了智能湖仓、AI 模型及应用程序当中数据和 AI 的发现、治理与协作形式。
借助基于 [Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail) 构建而成的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Catalog,企业可以使用具有细粒度访问控制的单一权限模型,以一致方式定义并实施访问策略。这份统一的目录使得工程师、数据科学家和分析师们能够使用由生成式 AI 创建的元数据所支持的语义搜索,从而安全发现并访问已获批准的数据及模型。
数据质量方面,Amazon SageMaker Catalog 新推出了数据质量保障功能,包括数据分析、数据质量建议、数据质量规则监测与警报等。通过将基本规则的方法同[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)结合起来,由此支撑起能够做出更好业务决策的工具。
Amazon SageMaker 还提供强大的保障措施和工具以制定负责任的 AI 策略,从而将 AI 治理提升至新的高度。这种整体方法不仅简化了运营流程,同时也在整个组织中建立并维护起宝贵的信任,为负责任且高效的 AI 开发与部署设定了新的标准。
整体看下来,新的 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 的核心目的在于彻底解放开发人员,把复杂的 Gen AI 技术本身,在云服务的范畴内,再次变回“自来水龙头”,降低工程实现难度,实现“打开即用”的效果。re:Invent 的第三日发布,与其说是“秀技术",不如说是秀“用户理解”。
**与 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 联动,降低技术门槛**
与 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 的联动也是下一代 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 带来的一大惊喜。
在今年的 re:Invent 大会上,亚马逊云科技宣布对 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 进行新一轮增强,相关功能包括自动执行单元测试、提供文档与代码审查智能体等*(延伸阅读:*[*《6 款大模型官宣后,生成式 AI 淘汰赛的号角正式吹响了》*](https://mp.weixin.qq.com/s?\\__biz=MjM5MDE0Mjc4MA==\\&mid=2651227734\\&idx=1\\&sn=3efa178f115c66131f13572636629f14\\&scene=21#wechat_redirect?trk=cndc-detail)*)。
下一代 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 集成了由 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 提供支持的内置生成式 AI 能力,能够引导用户轻松地进行数据和 AI 探索,将复杂的任务转化为直观的对话。在 Amazon SageMaker Unified Studio 中,[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 可以在整个流程之内协助支持用户的数据发现、编码、SQL 生成以及数据集成等开发性任务。例如,用户可以向 [Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) 提问“我该使用哪些数据来更好地了解产品销售情况?”或者“生成一条 SQL 语句,按照产品类别计算经营总收入。”
因数据管理和分析存在一定的技术门槛,企业通常面临技术人才短缺难题,这也是行业的一大痛点。[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 的引入进一步降低 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 使用门槛,不仅简化了数据管理流程,还通过集成的生成式 AI 能力,使得非技术背景的用户也能以自然语言与复杂的数据集和分析工具进行交互,直接参与到数据探索和分析中来。
为了“打下技术门槛”,下一代 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 还提供了丰富的[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和 AI 功能,包括数据整理、使用 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) Ground Truth 进行人机交互式数据标注、实验、MLOps、以及 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) HyperPod 托管的分布式训练等。在未来,这些 AI/ [机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)功能将被统称为 Amazon SageMaker AI,面向希望专注于大规模构建、训练和部署 AI/ [机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型的用户。
[Amazon Q](https://aws.amazon.com/cn/q/?trk=cndc-detail) Developer 与 [Amazon SageMaker](https://aws.amazon.com/cn/sagemaker/?trk=cndc-detail) 的联动,几乎是意料之中的——他们都服务于开发者体验,进而影响整个企业的研发效率和资源利用度。这是在亚马逊云科技众多服务中,逐步形成的一种“化学反应”。
### 大模型“商场”:百款热门模型“上架”
re:Invent 2024 带来的惊喜还有 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) Marketplace,这是 [Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 推出的一项新功能,它允许开发人员发现、测试并使用 100 多种流行的基础模型。目前,[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) Marketplace 已正式上线。
其中包括 Mistral AI 的 Mistral NeMo Instruct 2407 模型、Technology Innovation Institute 的 Falcon RW 1B 和英伟达 NIM 微服务等流行模型,以及各种专业模型,例如 Writer 的 Palmyra-Fin(用于金融行业)、Upstage 的 Solar Pro(用于翻译)、Camb.ai 的文本转音频 MARS6 和 EvolutionaryScale 的 ESM3 生成式生物学模型。
随着生成式 AI 不断重塑企业运作方式,市场对于面向特定领域、语言或者任务进行优化的专用模型的需求也在增长。然而,寻找和评估这些模型通常是一个既困难又昂贵的过程。用户不得不跨越多个服务来发现、构建这些模型的抽象,并在应用程序中使用它们,同时还需要建立复杂的安全和治理层。
选择权大于一切!正如亚马逊云科技反复提到的:“Choice matters”。
[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) Marketplace 试图通过提供一个统一的界面来访问各种专用和通用的基础模型,解决企业对大模型的“选择困难症”。
新引入的热门模型还包括:
* **Luma AI 的 Ray 2 模型**:Luma AI 的多模态模型及软件产品尝试利用生成式 AI 改进视觉内容创作。亚马逊云科技将成为第一家向客户提供 Luma AI 旗下最强 Luma Ray 2 模型(其知名视觉生成模型的二代版本)的云服务商。Ray 2 标志着生成式 AI 辅助视频创作的重大进步,其能够根据文本和图像高效生成高质量且栩栩如生的视频,质感足以与电影相媲美。客户可以快速尝试不同的镜头角度与表达风格,创作出具有更佳一致性和精确物理特性的视频,借此为建筑、时尚、电影、平面设计和音乐等应用场景提供创意启发。
* **Poolside 的 malibu 与 point 模型**:Poolside 解决了大型企业面临的现代软件工程挑战。亚马逊云科技将成为第一家提供 Poolside malibu 与 point 模型访问权限的云服务商。这些模型在代码生成、测试、文档及实时代码补全等方面表现出色。这使得工程团队得以提高生产力、快速编写出更高质量的代码并缩短产品开发周期。这两套模型还能根据客户的代码库、实践及文档素材以安全、私密的方式进行微调,从而快速适应特定项目,帮助客户以更高的准确度和效率处理日常软件工程任务。此外,亚马逊云科技也将成为首家提供 Poolside Assistant 访问权限的云服务商,该助手能够将 Poolside Malibu 与 point 模型的强大功能与开发者的首选集成开发环境(IDE)整合起来。
* **Stability AI 的 Stable Diffusion 3.5 Large 模型**:Stability AI 是视觉媒体领域领先的生成式 AI 模型开发商,掌握着面向图像、视频、3D 及音频等多个领域的顶尖模型。[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 将很快引入 Stable Diffusion 3.5 Large,这也是 Stability AI 旗下最先进的文生图模型。这种新模型可以根据不同风格的文本描述生成高质量图像,快速为媒体、游戏、广告和零售等领域的客户创建概念设计、视觉效果和充满细节的产品图像。
Swami Sivasubramanian 博士表示,“随着客户的快速聚集,[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 也始终保持着高速增长。该服务拥有丰富的领先模型选项、可轻松实现数据自定义的工具、内置负责任 AI 功能并具备开发复杂智能体的能力。[Amazon Bedrock](https://aws.amazon.com/cn/bedrock/?trk=cndc-detail) 正帮助开发人员解决他们当前面临的最大障碍,确保客户能够充分发挥生成式 AI 的技术潜力。借助这组新功能,我们正帮助客户开发出智能化程度更高的 AI 应用程序,借此为最终用户创造更大的价值。”
> *前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。