Amazon DataZone 新增功能

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/ANT202-What_s_new_in_Amazon_DataZone-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 组织需要加快编目、发现、共享和管理存储在亚马逊云科技、内部部署和第三方源中的数据。在本讲座中,您将了解 [Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail) 如何授权管理员和数据管理员(以及其他数据用户)管理和治理数据访问的能力,确保使用适当级别的权限和上下文进行访问。了解 [Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail) 中的创新如何使工程师、数据科学家、产品经理、分析师和业务用户能够轻松地在整个组织中共享和访问数据,以便他们可以通过共享数据和工具连接数据人员,并利用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)自动发现和编目数据。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共900字,阅读时间大约是4分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 亚马逊云科技(Amazon Web Services)一直致力于创新,并助力客户实现创新。在2022年re:Invent上,亚马逊展示了其最新的创新成果——[Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail)。产品负责人Sheka Verma在演讲开始时强调了亚马逊云科技的以客户为中心的方法。他们的目标始终是首先了解客户的痛点和挑战,从而创造DataZone来解决这些问题。 Verma解释道,一个普遍的痛点是每位客户都希望能更加数据驱动,但实际操作起来却非常困难。许多障碍阻碍了组织内部数据的获取和使用。找到合适的数据很困难,即使找到了,获得适当的访问权限并信任这些数据同样困难。将数据连接到人们想要使用的工具也是一个挑战。让团队在数据上协作增加了复杂性。此外,使用现有的解决方案在数据和工具上保持一致的管理几乎是不可能的任务。 因此,亚马逊看到了为客户提供规模化自助服务分析的需求。Verma概述了DataZone旨在提供的五个关键组件:1)在整个组织内发现、理解和访问数据;2)使用不同工具与多人共同合作解决数据问题;3)将数据连接到各种分析和商业智能工具;4)通过单一面板门户驱动自助服务;以及5)在数据和工具上应用一致的管理。 为了展示这些功能,Verma在现场演示了DataZone。在一个场景中,财务团队希望访问由销售团队拥有的零售销售交易数据集。财务团队的成员有不同的角色,他们希望使用不同的工具,如Athena、QuickSight和SageMaker。使用DataZone,财务用户可以找到销售数据资产,查看诸如数据所有者和质量分数等关键信息,并提交订阅请求。销售团队批准该请求后,财务用户可以立即在他们的选择工具中访问数据,而无需任何手动设置。演示展示了DataZone如何简化数据发现、访问和连接。 韦玛深入研究了DataZone的关键概念和功能。DataZone是一种数据共享组织结构,可以是按业务线或部门划分。客户可以使用一个或多个领域来控制数据的共享程度。诸如Glue和Redshift表之类的数据资产可以与来自任何来源的自定义资产一起发布。商业词汇表和元数据表增强了数据的搜索性和可信度。项目允许团队成员针对特定数据和工具的用例进行协作。环境代表了与项目关联的基础设施和工具。 DataZone的总经理史蒂夫·麦克弗森详细介绍了受控数据共享的核心功能。DataZone引入了发布和订阅的概念,以授权访问和数据共享。数据生产者将他们的数据发布到目录中,而消费者通过订阅、搜索和请求访问。这使得数据共享更加正式化,而不是依赖于非正式的沟通。对于已发布数据源(如Glue和Redshift),发现和发布可以自动化。订阅工作流将请求路由到数据所有者进行审核和批准。批准后,资产将在适当的环境中具体化以供消费。 最引人注目的宣布是新的人工智能(AI)集成进入了DataZone,这是2022年re:Invent刚刚推出的。麦克弗森强调,数据共享的一个巨大挑战是使数据易于理解,而不仅仅是连接它。描述必须手动创建,这是一项耗时的任务。借助AI自动化,DataZone现在可以生成可读的人造数据集和列描述,以增强搜索性和推荐用于使用的建议。这减轻了数据生产者的负担,并加速了消费者的数据发现。麦克弗森在现场演示了一个案例,展示了DataZone如何在1分钟40秒内从一个未知名称的Athena表中生成了完整的可读描述。AI集成缓解了大规模手工工作的负担,并允许对资产进行文档记录。 马赫什·钱德尼(Mahesh Chandni)担任CPP投资公司的数据平台负责人,他以一个客户的角度阐述了该公司的情况。他曾面临因数据分散和对所有数据需求的依赖而导致数据信任度降低的问题,这使得公司在处理数据蔓延、重复和数据缺乏方面遇到了困难。为了解决这些问题,他们决定迁移到基于数据网格原则的云数据平台,从而建立了一个具备自助服务共享功能的数据域。然而,构建自定义元数据管理、访问控制和编录的控制面仍然极具挑战性。幸运的是,DataZone作为托管服务提供了这些功能。对于CPP公司而言,DataZone不仅简化了架构,还加速了信息共享,并增强了数据理解。钱德尼对亚马逊云科技在构建DataZone时关注客户需求的做法表示赞赏。 在总结部分,韦玛提到了跨行业的许多其他客户也在采用DataZone,以利用其目录、发现和治理功能。她邀请与会者提供反馈,并在即将举行的re:Invent上了解更多相关信息。显而易见的是,[Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail)解决了使组织数据可访问和可理解的重大痛点问题。集成AI和重点强调自助服务的特点使其成为了一家企业的理想数据平台。亚马逊云科技已经展示了DataZone如何帮助客户重塑他们的数据分析方式。 **下面是一些演讲现场的精彩瞬间:** 领导者热情地向观众询问他们对即将进行的演讲的感受,并轻松地确认他们是否在即将到来的长活动中用餐。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_0.png) 领导的亚马逊云科技部门强调,在引入新功能时,应以客户需求为核心,这些功能将简化用户的数据发现和编录过程。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_1.png) 亚马逊云科技通过将数据源与用户的偏好工具连接起来,实现了协作和集中管理,使得数据分析变得更加简单。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_2.png) 通过提供用户访问数据的权限、协作功能、多样化的分析工具、统一的界面和治理,实现了自助服务分析。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_3.png) 领导者解释称,亚马逊云科技DataZone中的领域代表了业务线或组织层次结构,允许客户在其公司内部适当地共享数据。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_4.png) 数据消费者在使用之前会审查销售数据资产及其元数据,以了解并建立对数据的信任。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_5.png) 领导者强调了亚马逊云科技DataZone如何帮助像Bristol Myers Squibb和Thought Garden Health这样的跨行业公司。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT202-What_s_new_in_Amazon_DataZone/images/rebranded/ANT202-What_s_new_in_Amazon_DataZone_6.png) ## 总结 亚马逊数据区([Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail))致力于协助组织进行跨边界的编目、发现、治理和分析数据。它提供一个统一的入口,用户可在其中查找、理解和申请访问数据资产。数据生产者可将数据发布至数据区,并指定诸如所有者和质量等的元数据。消费者可订阅数据并通过审批来管理访问权限。 数据区项目将用户、数据和工具(如Athena、QuickSight和SageMaker)连接在一起。所有工具均采用相同的数据和治理原则。数据区还为每个工具提供基础设施支持。 数据区降低了安全共享数据的复杂性。领域促进了组织内部或不同部门之间的数据共享。目录、搜索和元数据(如术语表和表格)等提高了数据的可见性。 如今,数据区利用生成式AI来自动根据技术元数据自动生成描述,从而大大提高了解释的易理解性并节省了人工努力。这些描述解释了数据的用途和使用方法。 总之,数据区简化了数据访问、共享和理解的过程。通过连接数据生产和消费者,数据区使得组织更加依赖数据驱动决策。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭