【研究报告】数据与知识驱动的AI赋能生命健康研究
正文共:625字-4图
预计阅读时间:2分钟
闫峻博士团队所在的医渡云,主要从事医疗健康领域的数据基础设施建设,以支撑在此基础上的模型建设,应用场景和产业发展,继而产出新的数据与知识,形成闭环。当前医疗数据赋能的主要挑战包含数据应用、数据治理和数据集成三个方面。
针对数据应用的场景多样化,医渡云构建了数据智能集成系统,通过跨系统的唯一患者标识,联通患者数据,应用于多种场景,满足用户的个性化需求。
针对数据治理中存在的数据质量杂乱不一问题,团队通过多种自然语言处理方法,结合专业的医疗知识,形成医疗文书结构化建模能力(将自然语言文本转化为结构化医疗数据)、医学术语标准化处理能力(将描述不一的同类术语进行标准化)。
针对数据集成过程中的数据多源、异质、以及存在错误数据等问题,团队也搭建了完整的工具化平台,对数据生产全过程进行质控。
依托于上述数据集成系统所搭建的搜索引擎可实现高效、可视化数据检索分析,并可以帮助临床医生发现并验证想法,推进科学研究。
另外,团队还结合海量医学数据和专业知识,构建了模型化知识图谱。图谱中实体为各种疾病、对应的并发症、病因等。基于该图谱,系统可以以患者疾病指征为中心,提供针对用户的“一人一策”个性化服务。
来源 | 清华大学智能产业研究院
版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。
评论