Gut | 华科宁康组利用迁移学习克服区域效应实现微生物特征的跨区域疾...

生信宝典

共 6310字,需浏览 13分钟

 ·

2022-11-08 17:02

1fa466a98d63acee47b5fffe538494fc.webp

2022年10月,华中科技大学生命学院系统生物学与生物信息学系宁康教授团队,以华中科技大学为唯一单位在胃肠病学、肝病学国际顶尖期刊《GUT》发表题为“Overcoming regional limitations: Transfer learning for cross-regional microbial-based diagnosis of diseases”的研究论文,提出利用迁移学习来克服区域效应,实现基于微生物特征的跨区域疾病诊断。华中科技大学博士生王南为论文的第一作者,博士生程铭悦为第二作者,宁康教授为论文的通讯作者。




由于地理位置、饮食、种族、疾病等因素,尤其是地理位置因素的影响,不同地区人群的肠道微生物有非常明显的异质性。目前,基于微生物特征的机器学习方法已经被用于不同类型疾病的诊断当中,但是由于无法克服区域效应,这些方法在进行跨区域疾病诊断时准确性会大打折扣,无法满足基于微生物的跨区域疾病诊断的需求。

8bd799d7edafa2cd1f8d8ddae6b8bc41.webp

图1. 融合迁移学习以及神经网络的微生物组大数据分析框架。


针对以上问题,科研人员提出一种融合迁移学习以及神经网络的框架,此框架可以“借用”一个地区成熟的疾病诊断的知识,来用于另一个地区的疾病诊断,从而克服区域效应,实现基于微生物的跨区域疾病诊断。


在本工作中,科研人员将此框架应用于来自广东肠道微生物组项目(GGMP)的6,998个粪便微生物组样本,根据其来源将其划分为14个不同的地级市(区)。据结果显示,与从头训练模型相比,迁移学习模型进行跨地级市疾病诊断的准确性最具优势,并且将其应用到跨洲际队列的疾病诊断当中时,迁移学习模型仍具有更优越的准确性。此外,科研人员通过迁移学习发现了受地域因素影响作用较大的菌种,例如Clostridium,这些菌种可能对迁移学习模型在跨区域疾病诊断当中的有效性具有潜在的贡献。

aeb0f8118110d4656fc63b4b88963440.webp

图2. 该方法在多个不同疾病上显示了出众的诊断能力。


这项研究表明,迁移学习模型可以利用跨区域的微生物特征知识,实现基于微生物的跨区域疾病诊断,并且具有较高的准确性和鲁棒性。此外,这项研究为利用人工智能技术突破区域限制,在临床试验中实现基于微生物特征的跨区域疾病诊断提供了新的可行的途径。

需要指出的是:中国幅员辽阔,各地医生队伍水平参差不齐。本项目所提出来的基于迁移学习的人工智能方法,本质上是一种基于大数据的普适性的诊疗策略。这种策略的应用和推广,可以非常有效的克服地域差异所带来的诊疗质量问题,大幅度提高诊疗准确性和速度,帮助“新时代的赤脚医生”为人民群众提供更高质量的诊疗服务。


该研究得到科技部国家重点研发计划(No. 2018YFC0910502),国家自然科学基金(Nos. 32071465, 31871334, 31671374)等的资助。该工作也得到了GGMP项目主要负责人,南方医科大学周宏伟教授等的大力支持。


近年来,华中科技大学生命学院宁康教授团队在生物信息学交叉学科领域进行不断探索,针对人体微生物组学大数据,发展了一系列人工智能挖掘方法,并成功应用于肠道疾病、类风湿性关节炎、非传染性慢性疾病、人体癌症等多种疾病的前期诊断和复发监控,相关论文发表于PNAS、Gut(3篇)、Annals of the Rheumatic Diseases、Genome Biology、Genome Medicine、Gut Microbes等医学、生物学和生物信息学领域国际顶尖期刊。相关方法和模型,已经在合作医疗机构进行临床测试。

参考文献

Nan Wang, Mingyue Cheng, Kang Ning. Overcoming regional limitations: transfer learning for cross-regional microbial-based diagnosis of diseases. Gut, DOI: 10.1136/gutjnl-2022-328216.


- 通讯作者简介 -

4b99e6e66151d20ee8e23e24a3ead340.webp

华中科技大学

宁康

教授

宁康教授毕业于新加坡国立大学计算机专业,博士后工作于美国密歇根大学,现为华中科技大学大学生命科学与技术学院教授、博士生导师。宁康教授 长期从事生物信息学与大数据研究,在《PNAS》、《Genome Biology》、《Genome Medicine》、《Gut》等领域内顶级学术期刊上发表了超过100篇论文;文章总引用超过4000次,H指数30(Google Scholar)。获得软件著作权6项,申请国家发明专利20余项。担任国际期刊iMeta、Genomics Proteomics Bioinformatics、Microbiology Spectrum、Scientific Reports等编委。担任中国生物信息学学会-基因组信息学分会副主任,中国生物工程学会-计算生物学与生物信息学专业委员会委员,中国计算机协会-生物信息学专业委员会委员等。


往期精品(点击图片直达文字对应教程)

0dcbfd1ed08a33aed05fceac47605624.webp

3a47461dd70f42a727da29e58bd4e57a.webp

f507f356c1536c4328a64ac4cd03e9b7.webp

964037a8de6818d1e0af3753ae24eab3.webp

76f3b0cbaee5dae59689004444787eee.webp

8c8a235691cb032144f8d11aeffb6625.webp

16572d12a3fa1b17ced80998a41dfa03.webp

097a08e0c639c886ba9e9804b5b17ecf.webp

4e8701c4d57fba0987461c8274fcf8bd.webp

736ef7bf18db00ff3d14b0b18c884fce.webp

aa7a397476f5466c59c91179236489d3.webp

7784e97470f962b7809ee887f9b3adea.webp

06ffe606be5ac66d47ca60409c628e5c.webp

802c485849c1e20bf5619a67ed2a1b55.webp

c7087fbb422140c3a720eed37bda86eb.webp

8d5af911a4e8e0a1c79f43a7c2695284.webp

d869d10f191b0243a52dca8d8c398afa.webp

847fc7213110cb4cf5adbc98cef93602.webp

609321f9ab52575612e1b2f6c99aba5b.webp

80a493716d2a7b6a8a88f4719e313b24.webp

d7280e1064796798abad23a5406e7bfa.webp

279ff6548f4a3eacf1f2343e8ae9b5e2.webp

d8e191be4ba58a2d91d8c4b53a94932e.webp

dc229fed5f9f21fa1defc7c55f7e35c6.webp

46c134cfc33782c54c74182197ade953.webp

9e8b15ae65841554f1ccd9e6862a5c93.webp

5cb8828d937a7e397afc76d5b483e750.webp

3b88a6f7ef14475f2250bef830e31fc4.webp

机器学习

后台回复“ 生信宝典福利第一波 ”或点击 阅读原文 获取教程合集

7943d68bf6f86962996f65cf9df0d638.webp



浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报