钟南山团队携手腾讯研发新冠重症AI预测模型,登上Nature子刊
共 2298字,需浏览 5分钟
·
2020-07-28 16:23
钟南山院士团队与腾讯AI Lab一起,共同研发了一个预测COVID-19患者病情发展的AI模型。
这个模型可以分别预测5天、10天和30天内病情危重的概率,能更合理地对病人分别进行诊治。
众所周知,轻度的新冠患者通常是自限性的。
自限性,指疾病在发展到一定程度后,靠着机体调节控制病情发展、并逐渐恢复痊愈。
但并不是所有人都拥有非常强大的抵抗力。
研究显示,6.5%的新冠患者可能会突然发展为重症患者。
这些忽然转化为重症的患者不仅需要大量的医护资源,而且死亡率高达49%。
因此,尽早识别有重症风险的患者,及早进行病情干预,对于预测病情发展、以及医疗资源高效分配至关重要。
而这个模型,是基于AI对大数据的分析实现的。
基于深度学习的患者数据分析
事实上,准确预测重症患者的风险并非易事。
研究发现,临床上与重症患者相关的特征多达74个,如果要采用传统方法建立预测模型,恐怕难以实现。
经过考量后,团队决定采用深度学习,对大数据进行分析。
之所以采用深度学习,是因为它可以通过神经网络,对特征进行高阶非线性组合,从而更深层次地建立特征与目标函数之间的映射。
为了更精确地建模这10项特征与重症风险的关系,团队采用了结合Cox生存分析算法与LASSO算法的方式,来挖掘数据之中的隐含联系,进而计算病人的重症风险系数。
数据表明,研究团队一共对来自全国575家医院的1590名患者的数据进行了建模。
最终,经过分析,团队确定了10项能很好预测重症风险的患者特征:
10项特征包括:年龄、是否气促、是否有恶性肿瘤病史、是否有慢性肺阻、合并症数量、是否有 X 光平片异常、血液中性粒细胞与淋巴细胞比例、血液乳酸脱氢酶含量、血液直接胆红素含量、血液肌酸激酶含量。
这10项特征都可以通过正常检测途径获得,可用于预测重症病情的风险。
从这10项特征的单因素进行分析,可以发现,年龄是新冠肺炎发展至重症最大的风险之一。
事实上,超过60岁的新冠患者,病情发展成重症的概率明显更高。(老人更要保护好自己)
直观了解风险系数
研究团队在训练好的模型基础上,增加了一层线性Cox模型,便于产生可供医生解读的最终结果。
这层线性模型会按重要性,分别对深度学习模型的预测值与10项特征的值赋予不同的权重,并通过求和,得到最终风险系数。
模型可以通过诺模图手动进行计算。
诺模图,在临床上经常被用来综合各项数值换算最终评估分数。
通过诺模图,医生可以很直观地了解各项观察值与风险系数之间的关系,同时也可以在没有电脑的情况下手动计算风险系数。
上图是基于训练好的模型,对一位新冠肺炎患者的身体数据进行分析后,所得到的诺模图。
可以看见,这名患者的总体诺模图分数为 209,未来 5、10、30 天的总体重症概率分别为 0.58、0.62、0.69,因此被归类为有较高的重症风险。
更好的预测效果
实验证明,这个AI模型相比于此前的经典Cox模型,具有更高的预测准确性。
经过训练,模型在测试集上的准确性(C-index)从0.876提升到了0.894,AUC(用于衡量检测方法真实性)从 0.889 提升到了 0.911。
不仅如此,采用这种模型对另外1393个外部检验患者的数据进行分析后,发现预测的效果非常好。
在这1393个患者中,共有106个患者发展成重症,只有2例数据异常的患者被错误地划分到了低风险组。
除此之外,研究团队还对不同地理区域、卫生资源的三组数据进行了测试,包括武汉940例、湖北省武汉市以外的地区380例,以及广东73例,准确性分别为0.878、0.769和0.967。
排除10个临床特征参数缺失超过3个以上的患者后,准确性上升为0.890、0.852和0.967,表明这项模型具有很好的普适性。
除此之外,这个AI预测模型还有更多优势,例如可以自动填补缺失的数据,以及可以随着应用数据的增加而不断进化,令准确性再一步提高。
研究于2020年7月15日发表在国际顶级期刊「Nature」的子刊「Nature Communications」上,目前已开源。(项目链接见文末)
感兴趣的小伙伴们,可以戳下方传送门查看项目代码~
作者介绍
一作有两位,分别是梁文华博士与姚建华博士。
梁文华博士,来自广州医科大学附属第一医院,专业方向为肺癌及肺部结节的综合诊治,尤其基因检测、靶向治疗及免疫治疗、术后跟踪等。
姚建华博士来自腾讯AI Lab,目前在医疗中心就任首席科学家。
与此同时,钟南山院士、广州呼吸健康研究院院长何建行、腾讯AI Lab医疗中心负责人黄俊洲也为共同作者。
传送门
网站链接:
https://aihealthcare.tencent.com/COVID19-Triage_en.html