构建生命科学数据战略,加快提升洞察力

云计算
re:Invent
0
0
## 视频 <video src="https://dev-media.amazoncloud.cn/30-LibaiGenerate/31-LiBaiRebrandingVideo/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights-LBrebrandingWCaptionCN.mp4" class="bytemdVideo" controls="controls"></video> ## 导读 随着生命科学公司继续将[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)工具(如生成式 AI)集成到其应用程序中,数据的可访问性和质量成为成功的关键驱动因素。在本论坛中,探索强生公司如何构建企业范围的数据战略和数据系统,以打破内部数据孤岛,并为其数据和生成式 AI 计划提供支持。从顶层视图了解组织的端到端数据战略及其对 AI 、ML和 NLP 的使用,以帮助数据科学家、临床医生、研究人员、开发人员和分析师更快地找到答案并生成见解,并将数据整合到他们的日常业务流程中。 ## 演讲精华 <font color = "grey">以下是小编为您整理的本次演讲的精华,共1200字,阅读时间大约是6分钟。如果您想进一步了解演讲内容或者观看演讲全文,请观看演讲完整视频或者下面的演讲原文。</font> 亚马逊云科技的AI/ML策略和领导者Valerie Delva在会议上探讨了如何构建整合数据战略以加速医疗和生命科学领域的见解和创新。她表示,诸如基因组学、[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和AI等领域的创新并非遥不可及的未来能力,而是现下即可付诸实践的技术,旨在深刻改善人类的健康和福祉。 为了提供背景,Valerie随后概述了医疗保健和生命科学组织在创建、存储和使用数据方面所面临的一些主要趋势和挑战。首先,加快研究、临床试验和新疗法的上市速度迫在眉睫。目前,研发一种新疗法需要近十年的时间(9年)和30亿美元的投资。如此漫长的时间表不仅影响着渴望更好治疗方案的患者,而且在经济上也是难以维持的。因此,企业必须更高效地利用数据来加速早期研究、临床开发和向支付者证明疗效,从而最终更快地将疗法带给患者。例如,可以利用真实世界数据来研究生物标志物、设计临床试验并向支付者证明疗效。 其次,不断增长的数据数量和复杂性正以惊人的速度扩张。例如,一个典型的实验室现在每天会产生来自细胞绘画、RNA测序和冷冻电镜等多种分析的数TB级别的基因组测序数据。然而,由于数据存储方式的局限,其中仅有3%的数据得到利用。此外,这些快速增长的数据集涵盖了不同的领域,如基因组、转录组、医学图像等。简单地将每种数据类型的存储规模扩大是极为困难的。 最后,生物制药公司越来越多地与学术研究中心、初创公司和人口研究合作伙伴等第三方展开合作。如今,超过50%的新药物产品都源于这样的合作关系。这使得有效发现潜在合作伙伴所拥有的数据、确定可共享的数据以及集成第三方数据格式变得至关重要。 在医疗保健和生命科学领域,应用生成性人工智能以加速创新方面具有巨大潜力。然而,训练生成性模型需要高效地管理大量高质量的数据。生物制药公司还需解决数据隐私、安全和访问控制等方面的重要问题。例如,预计在未来十年内,仅基因组数据就将达到40亿字节。尽管生成性人工智能有潜力提供即时见解,但实现其潜力的一大挑战是高质量数据的获取。公司需要制定明确的数据和基础设施战略,以将数据作为差异化因素。 近年来,这些挑战变得愈发严重。因此,亚马逊云科技为医疗保健和生命科学领域开发了一系列专为目标设计的服务和解决方案。她强调了像Amazon HealthLake这样的服务,用于存储和分析基于文本的健康数据。HealthLake的一个关键功能是可以自动将非结构化数据如医生笔记转换为结构化数据,从而提供一个患者健康记录的时间线视图。 此外,她还提到了Amazon HealthLake Imaging,可以降低医疗成像存储成本高达40%,同时实现亚秒级的图像检索。HealthLake Genomics有助于大规模转换基因组、表达组和其他组学数据,以产生见解并推动科学发现。重要的是,所有这些服务都可以在几分钟内以多模式方式使其数据可用于分析和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)。 Valerie还提到了Amazon HealthLake for FHIR,它刚刚宣布符合HIPAA标准。HealthLake for FHIR允许客户以FHIR格式存储、查询和分析健康数据。 为了从临床文本中提取见解,她提到了[Amazon Comprehend Medical](https://aws.amazon.com/cn/comprehend/medical/?trk=cndc-detail),可以自动生成医学记录和注释并识别临床信息。最近,Valerie宣布Comprehend Medical现在符合HIPAA规定。 在数据合作、编目和访问领域,瓦莱丽详细介绍了适用于企业搜索和发现的[Amazon Kendra](https://aws.amazon.com/cn/kendra/?trk=cndc-detail)。通过可配置的工作流程,Kendra能够在多个系统和数据存储之间匹配和链接相关记录,设置过程只需数分钟。为了便于发现和集成第三方现实世界数据,她还讨论了亚马逊云科技 Data Exchange的功能。这一服务使得研究人员在云中寻找、订阅和使用第三方数据,从而节省了每年数百万美元的客户对现实世界数据的许可费用,并将建立群体所需的时间从几周缩短至几天甚至几小时。 在组织不希望直接共享数据的场景下,亚马逊云科技提供了安全分析和协作的Clean Rooms,避免暴露底层数据集。此外,瓦莱丽还介绍了亚马逊云科技 Lake Formation(用于跨存储系统编目)和 DataZone(用于构建受治理的企业数据生态系统)的使用。 瓦莱丽强调,整合数据战略的目的是使数据更具可操作性和意义,并为实现关键使用案例(例如,更早期地检测疾病或设计更好的试验)提供见解。亚马逊云科技的医疗保健数据服务和解决方案有助于降低在企业规模上构建所需的时间和资源。 随后,瓦莱丽邀请强生公司的达米尔·萨赫卡尔分享现实案例。达米尔阐述了他们在研发与将疗法提供给患者之间的桥梁作用。他还分析了美国医疗保健行业的几大趋势,包括支付回扣高达390亿美元的强生公司、提供者整合以及COVID-19疫情对面对面互动的影响等。 达米尔进一步介绍了强生公司的"商业引擎"——收集数据源,运用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型推断见解,并与相关内容相结合以驱动跨渠道的个性化互动。他强调,随着疗法越来越个性化(如他们的多发性骨髓瘤细胞疗法),患者数据变得越来越重要。借助Patient 360洞察,能够确定哪些医生拥有适合特定疗法的患者。 目前,他们在某些特定领域面临着一些湖泊需要进行独立的ETL和数据协调工作,这降低了他们的灵活性。因此,他们正致力于开发像Patient 360和Provider 360这样的统一数据产品,并实施结构化治理策略。Darmesh强调,亚马逊云科技提供的服务,如Data Exchange、Clean Rooms和DataZone,都是这一进程的关键驱动力。 接下来,强生公司的Patrick Cody分享了一个关于如何将生成性人工智能应用于市场研究报告的假设性用例。他解释了一个检索增强型生成框架如何能够根据特定的商业问题对相关研究进行总结。Patrick系统地评估了各种模型和基础设施组件,基于性能、成本和安全性等因素。目的是加速解决方案的推出,以更好地服务于患者。 最后,Valerie再次强调了高质量数据在医疗领域对于生成性AI和[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)的重要性。她鼓励观众将面临的挑战转化为具有影响力的工作成果。Valerie提到了与儿童脑肿瘤网络的合作,以推进儿科癌症研究,并在演讲结束时提供了即将举行的相关会议的详细信息。 **下面是一些演讲现场的精彩瞬间:** 瓦莱里·德尔瓦负责领导亚马逊云科技的数据AI/ML策略和解决方案,他热衷于探讨如何构建集成的数据战略,以发掘[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)和生成性AI的各种应用。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_0.png) 在医疗保健领域,领导者们正在讨论如何使用[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型来整理数据并向客户提供相关且合规的内容。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_1.png) 德尔瓦强调了对整合患者数据的访问重要性,以便深入了解患者需求并提供个性化的治疗方案。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_2.png) 保罗·扬森博士在会议中特意留了一个座位给代表患者的第三方,以确保他们的利益在每个决策过程中都得到充分考虑。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_3.png) 亚马逊云科技系统性地评估AI组件,以优化针对特定应用场景的框架。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_4.png) 亚马逊云科技支持实施集成数据战略,使得数据具有可操作性和目标性,并与关键业务应用场景(如早期检测疾病或加速药物开发)保持一致。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_5.png) 会议现场的一张截图展示了亚马逊云科技领导者展示的医疗保健和生命科学领域的生成性AI应用案例。 ![](https://d1trpeugzwbig5.cloudfront.net/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights/images/rebranded/LFS203-Building_a_life_science_data_strategy_for_accelerating_insights_6.png) ## 总结 此次演讲主要探讨了构建整合数据策略以加速医疗和生命科学领域的洞察与创新。演讲内容包括: 瓦莱丽·德尔瓦首先阐述了四个关键行业趋势:加速新疗法的研究与开发速度;数据量与复杂性的指数级增长;更加依赖于外部合作;以及生成性人工智能的出现。她强调,高质量的数据对于发挥AI的潜力至关重要,然而数据系统通常分散在不同的孤立领域中。 达赫什·塔克尔接着介绍了强生公司在肿瘤学、免疫学、心血管和神经科学等领域的关注方向。他谈到了商业团队如何在将疗法带给患者的过程中所面临的挑战,如折扣侵蚀净收入和对医疗保健提供者访问的限制。塔克尔解释了他如何通过[机器学习](https://aws.amazon.com/cn/machine-learning/?trk=cndc-detail)模型和真实世界数据等技术来解决这些问题,以便更好地了解患者的需求。 帕特里克·科迪展示了一个假设的使用案例,即通过生成性人工智能从其他孤立的供应商市场研究中提取见解。他提出了一种检索增强生成框架,以集中查询并限制幻觉。科迪强调了系统评估存储、模型和用户界面等组件的重要性,需考虑性能、成本和安全性等因素。 最后,瓦莱丽·德尔瓦再次强调了高质量、整合的数据在精准健康创新中的重要性。她提到了亚马逊云科技的专业服务如何能够实现安全的数据访问和多模式分析,以满足业务需求并改善患者成果。 ## 演讲原文 ## 想了解更多精彩完整内容吗?立即访问re:Invent 官网中文网站! [2023亚马逊云科技re:Invent全球大会 - 官方网站](https://webinar.amazoncloud.cn/reInvent2023/?s=8739&smid=19458 "2023亚马逊云科技re:Invent全球大会 - 官方网站") [点击此处](https://aws.amazon.com/cn/new/?trk=6dd7cc20-6afa-4abf-9359-2d6976ff9600&trk=cndc-detail "点击此处"),一键获取亚马逊云科技全球最新产品/服务资讯! [点击此处](https://www.amazonaws.cn/new/?trk=2ab098aa-0793-48b1-85e6-a9d261bd8cd4&trk=cndc-detail "点击此处"),一键获取亚马逊云科技中国区最新产品/服务资讯! ## 即刻注册亚马逊云科技账户,开启云端之旅! [【免费】亚马逊云科技“100 余种核心云服务产品免费试用”](https://aws.amazon.com/cn/campaigns/freecenter/?trk=f079813d-3a13-4a50-b67b-e31d930f36a4&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技“100 余种核心云服务产品免费试用“") [【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用”](https://www.amazonaws.cn/campaign/CloudService/?trk=2cdb6245-f491-42bc-b931-c1693fe92be1&sc_channel=el&trk=cndc-detail "【免费】亚马逊云科技中国区“40 余种核心云服务产品免费试用“")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭