生成式 AI 面板：超越大肆宣传，实现价值

云计算

re:Invent

## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读生成式 AI 正在激励公司思考 AI 如何重塑客户体验，改变我们的工作方式，并提高业务效率。生成式 AI 应用程序的成功取决于许多因素，包括确定正确的用例、选择正确的模型、管理[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)操作、优化[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)基础架构等。在本论坛中，听取来自各个行业的专家小组关于如何实现这一变革性技术的全部潜力的发言。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华，共1700字，阅读时间大约是8分钟。如果您想进一步了解演讲内容或者观看演讲全文，请观看演讲完整视频或者下面的演讲原文。</font> 视频内容涉及关于生成型人工智能（AI）的发展历程和当前状况的专业对谈。这场讨论由一位采访者主持，参与者包括五位从早期就开始研究生成型AI的专家：Ron Bodkin、Shruti Bhat、Dharshi Devatha、Jeremy Howard和Naveen Rao。在谈话开始阶段，采访者要求每位专家回顾过去十年左右生成型AI的历史。在亚马逊云科技负责AI基础设施的Ron Bodkin解释道，虽然神经网络的概念已经存在了很久，但从约2012年开始的当前AI时代，我们见证了随着模型规模和训练数据集的不断扩大，准确性的持续改进。这种改进符合良性循环或飞轮效应，即更大、更好的模型推动更多应用程序和基础设施投资，从而使得甚至更大的模型成为可能。从Ron的角度来看，亚马逊云科技的目标是通过提供诸如今天宣布的新型Trainium 2芯片这样的行业领先基础设施来加速这个飞轮，该芯片的性能比其前一代提高了4倍。 Shruti Bhat分享了她如何进入AI领域的有趣故事。在2009年，她在加州大学伯克利分校的一组[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)学生想要参加Netflix Prize竞赛，使用Apache Spark，但发现Hadoop对于涉及的迭代工作负载来说速度太慢。这个挑战促使Shruti和她的团队创建了一个早期的Spark Scala原型来解决效率问题。尽管当时他们还没有太多[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)的需求，但因为数据整理方面的挑战，Databricks成为了第一批客户。这表明了对于能够高效扩展AI工作负载的软件基础设施的迫切需求，这随后导致了各种像Spark、Ray这样开放源代码项目的诞生，以及用于加速大型语言模型的专用系统。达许·德瓦塔（Dharshi Devatha）深入研究了她与人工智能的长期渊源，从1990年代在大学时期研究神经形态计算架构，到2007年创立首家名为Nirvana Systems的人工智能芯片公司。那时，神经网络仍充满神秘，她希望能深入理解大脑的工作原理，从而构建更具大脑式学习能力的计算机。她在计算神经科学博士学位中所学的概念与现代人工智能系统有着许多相似之处。达许强调，硬件进步的飞轮效应至关重要，新硬件能力带来更大数据集和模型，推动新的应用场景，进而反作用于下一代硬件。她提到了人脑惊人的高效能，仅消耗20瓦功率，为节能人工智能提供了启示。达许认为，2012年的ImageNet突破是一个关键时刻，卷积神经网络终于有足够的数据和计算能力超越人类设计的特征。她坚信，我们现在正处在一个类似的拐点，因为像GPT-3这样的基础模型正在探索如何将不同的学习特征组合在一起，这可能在未来5-6年内推动重大创新。杰里米·霍华德（Jeremy Howard）通过对比过去的经验，解释了他对随机森林等传统[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)方法的理解。他认为，关于生成性人工智能的炒作源于其广泛的民间吸引力和像DALL-E这样的工具的可见性，使任何人都能访问和尝试，而[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)在过去对最终用户一直是非常专业和不明显的。当被问及我们是在经历一个炒作周期还是一个革命时，罗恩（Ron）表示，任何新技术的高涨预期都是正常的，但核心有一种真正变革性的能力，它将根本改变我们与计算机的互动方式和信息获取方式。他以我们曾经需要搜索关键词并在排名结果中筛选的例子为例，现在AI助手可以直接用相关精炼信息回答自然语言问题。罗恩相信，像GPT-4这样的高级模型可能让全世界的每个孩子都能拥有每个科目的专家导师，并且如果能够解决正确性和幻觉等主要挑战，还可以提供全球范围内的优质医疗服务。舒里蒂认为炒作周期在科技领域是不可避免的现象，她将这种现象与早期电力和核能新技术的未经检验的热情进行了类比。她表示，关键在于客观地看待当前展示出的实际能力——生成式模型已经在某些对人类来说非常困难且耗时的任务上提供了“足够好”的解决方案，而这些任务对人类来说相对容易验证。例如，文本到图像生成就是早期的例子，尽管不完美，但也能生成有用的图像来增强演示文稿和文档。她预测，随着模型变得越来越专业，它们将高度优化以适应特定任务，就像我们在日常生活中咨询领域专家一样。达什里承认存在炒作现象，但她认为这有助于将注意力、关注和投资集中在一项技术上。作为互联网泡沫时期的工程师，她当时对此不屑一顾，但现在回顾过去，她意识到炒作周期实际上是重大技术转型出现的方式——它吸引了人才来研究和创新新兴领域。这从过去的五年里AI和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)课程成为计算机科学课程的一部分就可以看出。她也同意模型将变得越来越专业，受到应用的经济和延迟要求的限制。较小的模型可能会主导许多工业和消费者使用场景，而大型模型则用于最尖端的应用。杰里米建议务实一些——如果你现在不用生成性AI，不要感到不知所措，只要开始尝试即可。基础模型的可用性使得通过针对你自己的数据进行微调来获得快速胜利变得相对容易。这建立了有价值的机构知识，以真正了解该技术可能对你的业务或组织产生的潜在影响。在选择模型规模的问题上，专家们普遍认为这主要取决于可用的数据和要解决的问题。如果盲目地使用大型模型而不考虑这些因素，可能会导致过拟合和高昂的成本。他们的建议是从小而简单开始，通过微调现有的开源模型以适应您的使用场景。在初步结果出来后，彻底评估是否真正需要一个大而定制的模型。数据质量和整理通常比模型规模更能决定性能。可以期待更多的集成和专门化模型链，就像在日常生活中咨询不同的领域专家一样。他们建议在实践者实施的优化中寻找最佳技巧，同时进行充分的实验以找到适用于特定应用程序的最佳方法。在讨论模型训练技巧时，专家们注意到，在高质量数据有限的情况下，微调非常有效。从头开始预训练大型模型需要大量的数据，而许多组织并不具备。提示调整和适配器调整也是新兴技术。关键是投资于数据清洗和整理，这使得即使小型模型在许多任务上也能表现出色，而不需要巨大的资源。例如，一些开源模型如Anthropic的Claude可以在有限的资源下通过仔细的微调达到很高的准确性。然而，某些任务，如数学推理，似乎仍然受益于大型模型。在部署方面，专家建议首先考虑用户的观点和体验——专注于实现他们想要的成果，而不是展示技术。在后台使用更小、更专门的模型链可以丰富和增强用户体验。使用用户喜欢的语言和形式与他们互动。避免过度杀青——您可能不需要一个博士级别的模型来回答针对消费者应用程序的琐碎问题。结合来自不同专业模型输出的集成方法是创新的巨大潜力所在。他们建议在扩大规模之前先优化性能，使用诸如张量并行和缓存等技术来最大化吞吐量。从培训开始时就要计划将模型投入生产，以保留后续的部署灵活性。讨论关于人工智能计算资源短缺问题的专家指出，应从使用较小的模型开始，而非一开始就追求数千个昂贵的GPU。为了充分利用云计算的灵活性和广泛的硬件生态系统，可以选择性价比高的适用于模型大小的GPU，如A10G。此外，应提前预留计算资源，例如使用亚马逊云科技的容量预留功能，以避免资源过剩。随着硬件技术的发展，预计计算能力将随着时间的推移而持续增强。专家建议开发灵活的软件来简化硬件复杂性和异构性问题。作为主要建议，专家呼吁在明确问题定义和验证方法的基础上从简单入手。还需认真考虑组织的限制条件，如规模和延迟要求。在实际操作中，应先评估是否可以调整开源模型以满足自身需求。在思考人类角色转变时，要全面考虑，而不仅仅是实现现有过程的自动化。应将此视为成本效益分析的一部分。在项目初期就关注部署和优化问题。无需过度思考，只需亲身体验以了解其可行性。预测未来将出现更多针对特定任务的优化模型。总的来说，这些专家为我们总结了过去十年生成性AI模型的快速发展，从早期的原型发展到如今的巨型模型，如GPT-3。他们讨论了伴随新技术而来的炒作周期，但同时强调已具备解决某些任务能力的模型的巨大潜力。他们还为企业提供了如何策略性地采用和部署生成性AI的建议，从利用开源模型从小规模起步，到全面优化生产限制，如延迟、成本和用户体验。关键在于谨慎地选择合适的模型类型和大小，以适应特定的任务、数据和业务需求。 **下面是一些演讲现场的精彩瞬间：** 在过去的十年里，人工智能一直处于自我强化的发展循环中，随着大型模型、海量数据和先进基础设施的不断壮大，持续推动着创新技术的突破。 ![](https://d1trpeugzwbig5.cloudfront.net/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value/images/rebranded/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value_0.png) 朗（Ron）详细阐述了这一现象。 ![](https://d1trpeugzwbig5.cloudfront.net/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value/images/rebranded/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value_1.png) 在亚马逊云峰会上，领导者们讲述了Spark如何解决大数据难题，并使[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)负载得以扩展。 ![](https://d1trpeugzwbig5.cloudfront.net/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value/images/rebranded/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value_2.png) 达什里（Dharshi）分享了她投身人工智能领域的心路历程，从20世纪90年代研究神经元计算开始，到如今在Databricks公司担任要职，致力于拓展和普及人工智能的应用。 ![](https://d1trpeugzwbig5.cloudfront.net/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value/images/rebranded/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value_3.png) 领导者们强调，虽然生成性人工智能已经在应对某些任务方面取得了显著成果，但仍然存在炒作和进步的空间。 ![](https://d1trpeugzwbig5.cloudfront.net/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value/images/rebranded/CMP209-Generative_AI_panel__Moving_beyond_the_hype_and_realizing_value_4.png) ## 总结专家组深入探讨了生成性人工智能的历史及其如何导致当前关于大型语言模型的热潮。他们从早期神经网络的发展，到2012年AlexNet和ImageNet的突破性成果，都进行了详细的回顾。这些成果充分展示了扩大模型和数据潜力的巨大影响。这一发展启动了一个良性循环，更大规模的模型催生了新的应用，进而推动了对基础设施的投资，使更大规模的模型得以实现。对于正在尝试运用生成性人工智能的组织，专家们提出了三个关键建议：首先，明确你希望解决的具体问题或要完成的任务。虽然生成性人工智能擅长提出解决方案，但你必须有一种方法来有效评估这些解决方案的质量。其次，从小规模且简单的问题入手。在尝试大规模预训练之前，可以先用开源模型进行微调，以此作为概念验证。这需要大量数据和基础设施的支持。最后，从一开始就要考虑部署和扩展。实际应用中的成本和延迟限制可能需要较小的、更优化的模型，而非最大、最具能力的模型。总之，专家们强调，尽管生成性人工智能具有革命性的潜力，但目前实际应用中的进展已经超越了炒作。通过关注特定应用场景并建立专业知识，组织可以策略性地利用这些模型来增强人类能力并改变工作流程。 ## 演讲原文 ## 想了解更多精彩完整内容吗？立即访问re:Invent 官网中文网站！ [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处")，一键获取亚马逊云科技全球最新产品/服务资讯！ [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处")，一键获取亚马逊云科技中国区最新产品/服务资讯！ ## 即刻注册亚马逊云科技账户，开启云端之旅！ [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家