联邦学习:举众人之力开发AI

描述

近日发表在《自然医学》上的研究结果表明,联邦学习能够建立强大的AI模型并在不同的医疗机构中进行推广。这一发现展示了AI在能源、金融服务、制造业等领域进一步应用的前景。

由新冠疫情引发的一项多家医院联合发表的倡议表明,任何行业的机构都可以通过合作开发预测性AI模型,在准确性和通用性方面树立新的标杆。

这项合作于今日发表在领先的同行评议医疗杂志《自然医学》上,展示了保护隐私的联邦学习技术如何创建强大的AI模型,这些模型能够在不同的企业机构中运行良好,即便是在受到保密数据或稀疏数据限制的行业。

该研究的第一作者Ittai Dayan博士表示:“在AI开发过程中,当在一家医院的数据上创建一个算法时,这个算法一般在任何其他医院都不能很好地工作。” Ittai Dayan博士在Mass General Brigham领导AI开发工作并在今年创立了医疗初创企业Rhino Health。

“但通过使用联邦学习和来自各大洲的客观多模态数据来开发模型,我们就能够建立一个能够帮助全球一线医生的可推广模型。” Ittai Dayan表示。

其他大规模联邦学习项目已在医疗行业展开,包括一项关于乳房X光检查评估的五人研究以及制药巨头拜耳公司一项用于脾脏的分割解剖的AI模型训练工作。

除了医疗行业之外,联邦学习还可以帮助能源公司分析地震和井筒数据,帮助金融公司改进欺诈检测模型,帮助自动驾驶汽车研究人员开发泛化至不同国家驾驶行为的AI。

联邦学习:举众人之力开发AI

开发AI模型的公司和研究机构通常受到其可用数据的限制。这可能意味着较小的企业机构或小众研究领域缺乏足够的数据来训练准确的预测模型。即使是大型数据集,也可能因一家企业机构的病人或客户人口特征、特定的数据记录方法、甚至所使用的科学设备品牌而出现偏差。

为了收集足够的训练数据来建立一个强大的、可推广的模型,大多数企业机构需要与同行汇集数据。但在许多情况下,数据隐私法规限制在共用的超级计算机或云服务器上直接分享数据,例如病人的医疗记录或专有数据集等。

这就是联邦学习的用武之地。

《自然医学》杂志发布的这项新研究被称为EXAM(EMR CXR AI模型)。该研究由Mass General Brigham和NVIDIA主导,将五大洲的20家医院聚集在一起训练神经网络,该网络用于预测出现新冠肺炎症状的病人在到达急诊科等护理点的24和72小时后可能需要的氧气补充水平。这是迄今为止最大、最多样化的临床联邦学习研究之一。

多方合作助力AI工作

联邦学习使EXAM的合作者能够创建一个从每家参与医院的胸部X光图像、患者生命体征、人口特征数据和实验室数值中学习的AI模型,并且无需访问存储在各家医院私人服务器中的私人数据。

每家医院都在本地的NVIDIA GPU上训练同一个神经网络的副本。在训练过程中,每家医院只需定期向中央服务器发送更新的模型权重,中央服务器中的全局版本神经网络将它们汇总起来,形成一个新的全局模型。

这就像分享考试的答案,但并不透露任何用于得出答案的学习材料。

美国国家卫生研究院(NIH)介入肿瘤学中心联合作者兼总监、临床中心介入放射科主任Brad Wood博士表示:“EXAM研究的结果表明,能够在不需要交换私人可识别数据的情况下在医疗领域训练高性能和可推广的AI模型,从而保护数据隐私。”

“这些发现不仅仅可以用于新冠肺炎相关预测的跨医院模型 ,并展示了联邦学习是该领域的一项有前途的解决方案。这为实现更有效和合规的大数据共享提供了框架,并且为挖掘AI深度学习在医学领域的潜力提供支持。”

与所有参与机构共享的全局EXAM模型使AI模型的平均性能提高了16%。研究人员发现,与在任何单一站点训练的模型相比,全局EXAM模型的通用性平均提高了38%。

从上图中可以看到,对于拥有较小数据集的医院来说,全局联邦学习的性能提升尤其明显。

泰国朱拉隆功大学和朱拉隆功国王纪念医院AI医学中心联合主任Sira Sriswasdi表示:“联邦学习使全球各地的研究人员能够为一个共同的目标进行合作,开发出一个能够从每个人的数据中学习和归纳的模型。“该医院是合作开发EXAM的20所医院之一。“通过NVIDIA GPU和NVIDIA Clara软件,我们能够很轻松地参与这项研究,产生有影响的结果。”

医院和初创企业进一步开展EXAM研究

最初的EXAM研究汇集了北美、南美、欧洲和亚洲的合作者,只用了两周训练就实现了对病人氧气需求的高质量预测 ,这一洞察可以帮助医生确定病人需要的护理水平。

此后,该研究的合作者验证了该AI模型能够在建立和训练该模型的地点之外的环境中进行推广并表现良好。马萨诸塞州的另外三家医院(Cooley Dickinson医院、Martha‘s Vineyard医院和Nantucket Cottage医院)测试了EXAM,发现该神经网络在独立的、从未见过的数据上也表现良好。

Cooley Dickinson医院发现,该模型能够预测病人到达急诊室后24小时内的呼吸机需求,其敏感性为95%,特异性超过88%。英国剑桥的Addenbrookes医院也发现了类似的结果。

开发原始模型的MGH&BWH临床数据科学中心科学主任Quanzheng Li博士表示,Mass General Brigham计划在不久的将来部署EXAM。该医院网络与Lahey医院和医疗中心以及英国的NIHR剑桥生物医学研究中心一起与英伟达初创加速成员Rhino Health合作,使用EXAM开展前瞻性研究。

最初的EXAM模型使用过去新冠肺炎患者的记录进行回顾性训练,因此研究人员已经掌握了关于患者最终需要的氧气量的真实数据。这项前瞻性研究将AI模型应用于新入院患者的数据,朝着在现实环境中部署AI模型又迈出了一步。

剑桥大学医学院放射科主任Fiona Gilbert表示:“联邦学习具有革命性的力量,可将AI创新融入到临床工作流程中。我们与EXAM的长期合作旨在使此类全球合作变得可重复和更有效,满足临床医生应对复杂健康挑战和未来流行病的需求。”

EXAM模型通过NVIDIA NGC软件中心公开,供研究者使用。企业和研究机构在开始使用联邦学习时,可以使用NVIDIA AI Enterprise软件套件中的AI工具和框架。该套件经过优化,可在NVIDIA认证系统上运行。

责任编辑:haq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分