学术前沿丨危险因素筛查与评估分层的人工智能技术应用
中国心血管病患病率及死亡率仍处于上升阶段,以心肌梗死为代表的缺血性心脏病,更是成为全球疾病致死的首要原因。心血管病发病因素多、病程长、干扰因素多、发病机制复杂,难以精确构建传统的数学模型。
人工智能是研究、开发用于模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学,也是在计算机科学、心理学、语言学、统计学、哲学等多个学科研究基础上发展而来的综合性学科,是21世纪三大尖端科技之一。
人工智能方法可利用各种模糊逻辑理论的分类及回归算法、人工神经网络算法、机器学习算法等技术手段,根据输入的经验和信息,以及构建概念,完成那些对人类来说容易执行但难以形式化描述的任务,解决“无师自通”的辨识问题。
心血管病早期筛查对象范围广、筛查项目多,应用人工智能的技术与方法也不尽相同。本文从危险因素筛查与评估分层这个层面对人工智能技术应用进行分析研究。
根据国内外最新的流行病学和心血管病防治的循证医学证据,我国制定了《中国心血管病风险评估和管理指南》,并将其作为开展心血管病风险 评估和危险因素管理的指导方案,包括心血管病 10 年风险和终生风险评估的流程、风险分层依据和风险 评估工具的使用。
在《中国心血管病预防指南 (2017) 》《中国成人血脂异常防治指南(2016 年修订版) 》中,将5%和10%的缺血性心血管病风险分别作为划分心血管病风险低、中、高危的切点值,再结合个体病史、风险水平等因素进行分层管理。
2016年逄凯等使用人工智能机器学习的随机森林算法,提出了仅包含年龄、性别、职业、平均睡眠时间和体格检查指标等变量的冠心病筛查模型(敏感性80. 75%,特异性63.45%) 。
该模型能够在保证精度的前提下减少所需输入信息,显著提高疾病筛查的时效性和模型的易用性,显示出人工智能方法应用于冠心病早期筛查及评估的潜力。此外,从样本数据的变量重要性排序中,还可以获得疾病影响因素排序,有助于指导心血管疾病的日常监督和管理。
2016 年杨学礼团队基于中国10年大样本队列数据研究,建立了更符合中国人群特点的中国缺血性心血管病危险预测模型,即China-PAR模型。
该模型以性别、年龄、现居住地、地域、腰围、总胆固醇(TC) 、高密度脂蛋白胆固醇(HDL-C) 、血压、服用降压药、糖尿病、吸烟、心血管病家族史等为输入指标,整合了“中国心血管健康多中心合作研究”( In- terASIA) 、“中国心血管病流行病学多中心协作研究”( ChinaMUCA) 等4项最新的中国人群前瞻性队列随访数据,总样本量达12万,得到了更符合中国人群特点的低、中、高危切点划分。
预测模型采用综合区分度改善指数、净再分类改善指数等统计量和事先确定的纳入及排除标准,进行模型自变量的筛选; 以统计学及多变量多函数的逻辑关系为基础,对新危险因素的增量信息建立数学模型并进行预测。
在杨学礼团队的上述定性分层研究中没有用到人工智能的模糊逻辑理论与方法,但若要对某一群体进行更准确的危险分层,则要以此为基础进一步细化模型并增加危险因素。
上述研究主要是以普通人群为研究对象,以统计学及多变量多函数逻辑关系为基础,通过建立人工智能预测模型,对新风险因素的增量信息建立数学模型进行预测。
目前的定性分层研究中没有使用人工智能的模糊逻辑理论方法,但作为后期人工智能方法的应用基础,可再纳入变量及其定义,开展前瞻性队列分层研究,依托现代计算机技术能力的增强和数据样本的增多,利用人工智能技术有望建构实用性较强的预测模型。
[1]季伟敏,唐士敏,何俊德,王学斌,尹微,葛以山,罗显元.心血管病早期筛查的人工智能技术应用[J].实用心电学杂志,2021,30(02):89-92+103.