如何使用亚马逊DataZone建立商业目录

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 对组织来说,有效组织数据并确保适当的访问控制以驱动及时的发现,从而增加商业价值,这一点非常关键。在本次 ANT207 的后续演示中,您将了解如何通过 [Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail) 这个统一的数据分析门户,在组织边界之间大规模共享、搜索和发现数据。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共1000字,阅读时间大约是5分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 普里亚·泰·戴伊,作为亚马逊DataZone的高级项目经理,她在演讲开始时承认了许多组织当前面临的主要挑战:使数据在整个公司内易于发现和利用。她介绍了[Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail),这是亚马逊在2021年峰会上宣布的一项新的数据管理服务,并于2022年10月开始普遍可用。DataZone帮助企业构建一个活跃的元数据层,使得组织内的每个人都可以轻松找到、理解和订阅数据资产(若选择)。这实现了跨业务部门和角色的广泛数据发现和利用。 普里亚详细阐述了DataZone提供的四种核心功能,以支持构建商业数据目录: 首先,DataZone提供组织域,使公司能够追踪数据所有权——资产来自哪里以及谁负责它们。这种对数据来源的可见性在跨业务部门合作时了解访问级别至关重要。例如,市场营销团队可以更好地了解来自销售部门域的营销活动数据的背景。 其次,DataZone不仅允许技术细节(如模式)之外的大量元数据整理,还使需要理解结构的技术用户以及需要更多背景来理解数据代表的业务用户都能受益。公司在DataZone中可以创建包含多达1000个标准化术语的定义的业务词汇表,确保特别对于可能跨业务部门具有不同含义的数据元素的一致理解。例如,术语“账户”可能指销售部门的客户账户或财务部门的账单账户。 此外,DataZone还提供可定制的元数据表单,以标准化方式向数据资产添加关键上下文详细信息。这有助于浏览和搜索目录的用户理解资产包含的内容以及如何使用它。普里亚将其比作在亚马逊中国上搜索产品并能看到所有产品详细信息(如尺寸、制造信息等),这些详细信息帮助你确切地了解你要购买的是什么。 普拉亚随后详细阐述了DataZone目录中数据的发现和可用性的整体过程:首先,将数据库、数据仓库以及亚马逊云科技的Glue等数据源纳入DataZone进行编目。Glue具备超过25个连接器,用于引入元数据。接着,使用词汇表、元数据表单以及其他描述性信息来添加相关的业务细节,以丰富技术资产。最终,允许用户搜索DataZone,订阅他们所需的资产,并将这些资产用于他们首选的分析、可视化或[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)工具中。例如,一位数据科学家可能会发现一个有用的数据集,了解其业务含义,然后用它训练一个[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型。 随着时间的推移,这些用户可能会变成提供者,通过编写他们创建的任何新资产,使其在公司内部的其他人中发现。例如,数据科学家可以将他们的模型列入目录,让业务分析师发现它并用它来进行预测和投影。 之后,普拉亚深入探讨了公司在DataZone中可以构建的基本组件:商业词汇表包含了标准术语的定义,确保了每个人对于可能跨业务部门具有不同含义的数据元素具有共同的理解。元数据表单使得能够一致地为资产添加标准化细节,有助于对编目数据的质量建立信任。表单可以由管理员和数据管理员根据公司标准创建。 普拉亚强调的一个关键好处是DataZone如何自动执行许多底层的资产整理和丰富工作。对于摄入,DataZone提供预构建的作业来从数据库、数据仓库和具有超过25个连接器的亚马逊云科技Glue等来源引入元数据。作业可以安排进行计划或按需运行,并且如果安排的来源发生变化,DataZone甚至会通知发布者,使他们能够通知订阅者潜在的下游影响。例如,如果一个数据分析师使用DataZone资产构建了仪表板,且架构发生变化,DataZone会警告发布者,以便他们可以通知分析师暂停他们的仪表板以防止错误。 对于整理,DataZone使用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)为资产和列生成建议的描述和业务名称,从而节省发布者手动操作的努力。普拉亚指出,令人兴奋的新功能将在接下来的日子里在主题演讲中宣布,以进一步简化元数据整理。 除了表格和列之外,DataZone还能够对各种类型的数据进行编目。这些数据资产包括仪表板、[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型、SQL查询和作业等。DataZone为这些资产构建了完整的业务工作流程和保管链,使得生产者能够查看订阅者并选择授予或限制消费者的访问。 接下来,Leo提供了一场演示来展示DataZone的功能: - 他创建了一个新的业务词汇表,包含了示例术语、定义和可选同义词。用户可以在词汇表中搜索特定的术语。 - 他创建了一个自定义元数据表单,包含了诸如认证状态、认证者和链接的术语等字段。可以将表单与词汇表术语进行关联。 - 他通过编辑列描述、添加3个词汇表术语以及填写自定义元数据表单的2个字段来丰富了一个样本数据资产。 - 当他点击发布时,该资产对于任何拥有访问DataZone目录权限的用户都变得可见和可发现。 总的来说,Pria解释说,[Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail)帮助企业建立具有词汇表、元数据表单和自动化精选功能的企业数据目录。这使得技术和非技术用户都能够轻松地找到、理解和订阅他们所需的生产力数据。新的自动化功能减少了制作人在精选资产方面的手动努力,同时仍然允许他们控制访问。 在几次re:Invent的会议上,提供了更多关于使用DataZone进行数据治理的信息,包括在人员、流程和工具方面。该服务使得大型组织中关键数据的发现、理解和协作变得更加容易。 **下面是一些演讲现场的精彩瞬间:** 数据资产页面涵盖了各种与资产相关的详细信息,包括名称、描述、技术元数据、分类、标签和业务术语,有助于发现和理解。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_0.png) DataZone能够自动从各种来源收集数据,并向发布者提供有关模式变化的通知,以防影响下游操作。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_1.png) DataZone支持收录各种资产,如仪表板、[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型、SQL查询、作业和链接,从而在数据生产者与订阅者之间建立业务工作流程。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_2.png) 演示者展示了查看为演示目的而创建的术语之间的详细描述和关系的能力。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_3.png) 领导者展示了如何配置亚马逊云科技Glue数据目录的元数据字段,使其具有搜索功能和必要性。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_4.png) 领导者推出了一系列新的主要课程视频,讲述如何将组织变革管理的最佳实践应用于采用亚马逊云科技的公司。 ![](https://d1trpeugzwbig5.cloudfront.net/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone/images/rebranded/ANT217-How_to_build_a_business_catalog_with_Amazon_DataZone_5.png) ## 总结 亚马逊[Amazon DataZone](https://aws.amazon.com/cn/datazone/?trk=cndc-detail)是一款数据管理服务,旨在帮助企业构建活跃的元数据层,使得公司内部的用户能够轻松地查找、理解和利用共享的数据资产。DataZone具备摄入数据的能力,通过对数据进行业务上下文的丰富和处理,使其具有可发现性。该服务支持创建组织领域、整理元数据、构建业务术语的词汇表以及使用元数据表单添加详细信息,以帮助用户更好地理解数据。DataZone还引入了技术元数据,为资产和列推荐业务名称。用户可以添加描述、链接术语并发布资产,使其具有可发现性。 除了处理表格数据外,DataZone还能编录其他资产,如[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型、仪表板和作业。它能跟踪数据线谱,让生产者了解哪些下游资产依赖于他们的数据。DataZone有助于自动化元数据的整理,且未来还将提供更多自动化功能。凭借其建立背景和保持一致性的能力,DataZone为企业数据目录提供了动力,使员工能够自信地发现和了解共享的数据资产。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭