电子说
麻省理工学院的计算机科学家希望通过自动化通常由手工完成的关键步骤来加速人工智能的使用,从而改善医疗决策,并且随着某些数据集变得越来越大,这一点变得越来越费力。
预测分析领域在帮助临床医生诊断和治疗患者方面具有越来越大的前景。可以训练机器学习模型以找到患者数据中的模式,以帮助进行败血症护理,设计更安全的化疗方案以及预测患者患ICU或死于乳腺癌的风险,仅举几个例子。
通常,训练数据集由许多患病和健康的受试者组成,但每个受试者的数据相对较少。然后,专家们必须在数据集中找到对于做出预测非常重要的那些方面或“特征”。
这种“功能工程”可能是一个费力且昂贵的过程。但是随着可穿戴式传感器的兴起,挑战变得更加严峻,因为研究人员可以更轻松地长期监控患者的生物特征,例如跟踪睡眠方式,步态和声音活动。在仅进行了一周的监视之后,专家们可以针对每个主题获得数十亿个数据样本。
在本周的医疗保健机器学习会议上发表的一篇论文中,麻省理工学院的研究人员演示了一种可自动学习预测声带疾病特征的模型。这些功能来自大约100个主题的数据集,每个主题具有大约一周的语音监视数据和数十亿个样本-换句话说,主题数量很少,每个主题的数据量很大。数据集包含从安装在对象脖子上的小加速度传感器获取的信号。
在实验中,该模型使用从这些数据中自动提取的特征对具有和没有声带结节的患者进行高精度分类。这些是在喉部形成的病变,通常是由于声音滥用的方式(例如敲出歌曲或大喊大叫)所致。重要的是,该模型无需大量的手工标记数据即可完成此任务。
“收集长时间序列数据集变得越来越容易。但是,有些医生需要运用他们的知识来标记数据集。”第一作者,麻省理工学院计算机科学与人工智能实验室(CSAIL)的博士生Jose Javier Gonzalez Ortiz说。“我们希望为专家删除该手册部分,并将所有功能工程转移到机器学习模型中。”
该模型可适于学习任何疾病或状况的模式。研究人员说,但是检测与声带结节相关的日常语音使用模式的能力是开发预防,诊断和治疗该疾病的改进方法的重要步骤。这可能包括设计新的方法来识别和提醒人们潜在的破坏性声音行为。
与冈萨雷斯·奥尔蒂斯(Gonzalez Ortiz)一起发表论文的是约翰·古塔格(John Guttag),他是Dugald C. Jackson计算机科学与电气工程学教授,也是CSAIL数据驱动推理小组的负责人。马萨诸塞州总医院喉外科和语音康复中心的Robert Hillman,Jarrad Van Stan和Daryush Mehta;多伦多大学计算机科学与医学助理教授Marzyeh Ghassemi。
全部0条评论
快来发表一下你的评论吧 !