结合呼吸音和咳嗽音,AI 识别阳性冠状病毒病例的成功率可达 80%
共 2056字,需浏览 5分钟
·
2020-11-06 06:36
技术编辑:徐九丨发布自:思否编辑部
相信大家都做过至少一次咽拭子核酸检测,口咽拭子采样还好,鼻咽拭子采样的感觉简直是酸爽。
或许是为了解决这一问题,很多高校组织都在研究一种新的检测方式 —— 借助 AI 算法,结合呼吸音和咳嗽音来进行检测。根据最新的一组数据显示,在经过官方检测呈阳性的患者中准确率达到了 98.5% ,在无症状的人中成功率达到了100% 。
一、来自顶级高校的科研力量
目前研究 AI 声音检测模型的主要是三家美国的高校组织 —— 剑桥大学、麻省理工学院以及卡内基梅隆大学。
1、麻省理工学院
目前准确率最高的算法模型就是由麻省理工学院(MIT)实验室构建的。麻省理工学院的科学家布莱恩·苏比拉纳是这个项目的论文作者之一。在这篇发表在《IEEE 医学与生物工程杂志》上的论文中,他表示: “当人们感染了 Covid,即使没有临床症状,发声的方式也会发生变化。”
目前麻省理工学院的实验室已经收集了大约 7 万个含有咳嗽音的音频样本,其中 2,500 例来自确诊冠状病毒感染的患者。
据悉,该 AI 模型似乎已经具备了基于声音强度、情绪、肺和呼吸功能、以及肌肉退化的细微模式变化,来分析和识别出新冠疫情无症状感染者的能力。
2、剑桥大学
早在今年 4 月份,剑桥大学便启动了这一 AI 检测项目,通过公开渠道向市民收集相关数据。市民可对着电脑的麦克风呼吸和咳嗽,并提供他们的年龄、性别、大致位置,以及最近是否对冠状病毒呈阳性反应的详细资料,然后被要求读三次: “我希望我的数据能够帮助管理病毒大流行。”
据悉在公告的第一天,大约 1200 人提供了完整的录音,其中 22 人表示最近检测呈阳性。
目前,该项目仅限于通过网站收集样本,而不是通过智能手机应用程序。这在一定程度上是因为苹果和谷歌正在限制谁可以在他们的商店发布冠状病毒相关的应用程序,而这种努力还没有达到标准。
3、卡内基梅隆大学
卡内基梅隆大学也有着类似的研究项目。他们研发的疫情语音检测器是建立在匹兹堡大学早期语音分析工作的基础上的。卡内基大学的项目于今年 3 月上线,同样要求用户提供咳嗽音,但不同的是还要求用户背诵一遍字母表,并提供自己的详细信息。
二、技术背后的风险
1、误诊
卡内基梅隆大学的项目曾经被主动暂停过一段时间。
项目团队成员之一的丽塔 · 辛格博士对此给出的原因是: “不管我们在产品中贴出多少免责声明,也不管如何清楚地告诉用户这种检测方式并没有经过医学验证,但仍有些人会把这种结果当成确诊的结果。”
虽然丽塔博士的测试场景是在美国,但放到国内可能也会出现类似的情况,就像不是所有人都能分清“建议”与“意见”。
如果 AI 告诉一个感染了病毒的人他没有感染病毒,那这个人很大程度会掉以轻心,而当出现临床反应时第一反应就是找提供健康检测结果的平台究责;如果 AI 告诉一个健康的人他感染了这种病毒,可能也会导致类似的结果。
因此,涉及到医疗领域的 AI 模型几乎没有任何犯错的余地,丽塔博士表示在正式应用前一定要通过技术方法消除这些风险。
2、被遗忘权
另一件事,就是被遗忘的权利,用户应该有能力在多年后再来找到收集信息的平台,按下一个按钮,便可以删除自己的声音样本。
但被遗忘权在当前互联网环境下,几乎是不可能实现的,这也导致这种需要收集处理用户敏感且无法修改的生理信息的方式,很难大面积的推行。
3、数据差异
数据差异化问题是由一位声音识别专家提出的。Audio Analytic 的产品是一款声音识别软件框架,可以通过声音来理解上下文的能力。该公司的首席执行官 Chris Mitchell 针对这类项目表示: “由于英国米德兰和伦敦正在经历最严重的疾病疫情,但两地的人们发声方式的存在着区域性的差异,这也意味着除非对数据进行严格控制,否则 AI 模型可能不能适配某些特殊的地区,从而产生不当影响。”
4、信息收集过程
信息收集的过程是一项很难控制的技术性的挑战,因为声音的不可控与不可量化的特性,在用户自主上传样本的阶段,不使用专业麦克风或者收音方式的情况下,获取符合规范的声音样本是非常困难的。因为
三、AI 的又一经典之作
人工智能专家 Calum Chace 是哲学科幻小说《潘多拉的大脑》的作者,他将这种基于声音进行检测的 AI 算法描述为「人工智能的经典之作」:
“这和给 AI 输入大量 x 光样本以便它学会检测癌症的原理是一样的,这是 AI 能发挥能力的一个例子。而且在这次实践中,我没有看到太多负面的反馈。”
人工智能的计算结果常常是随机的,不可解释的。但是从某种角度来说,这也是一个必然的过程。从人工智能领域来说,打破黑盒子,解释并给出解决方案,是一个探索过程,也是借助科技改变世界的方式。