麻省理工学院：通过咳嗽声，AI就能识别COVID-19-技术圈

↑↑↑点击上方蓝字，回复资料，10个G的惊喜

来源：大数据文摘

本文约2700字，建议阅读8分钟

最近发表在《IEEE医学与生物学工程学杂志》上的一篇论文中，麻省理工学院的研究人员表示，他们已经开发出可以识别COVID-19感染者咳嗽声的AI。

10月25日，喀什地区疏附县24日发现1例新冠肺炎无症状感染者后，新疆迅速对其密切接触者、密切接触者的接触者进行核酸检测，截至10月25日14时，检测出137人呈阳性，经专家诊断，均为无症状感染者。

后疫情时代，无症状感染者正成为疫情复发最大的威胁。没有任何胸闷发热症状，你和同伴可能很难区分是否感染了新冠。

但人工智能可以，只要你给TA听听你的咳嗽声。

在最近发表在《IEEE医学与生物学工程学杂志》上的一篇论文中，麻省理工学院的研究人员表示，他们已经开发出可以识别COVID-19感染者咳嗽声的AI。

论文地址：

https://www.embs.org/ojemb/articles/covid-19-artificial-intelligence-diagnosis-using-only-cough-recordings/

据论文显示，研究小组开发了一种AI模型，该模型通过分析你的咳嗽录音，可以将无症状感染者与健康的人区分开来。所有人都可以通过网络浏览器以及手机和笔记本电脑等设备自愿提交的录音。

研究人员称，该模型由他们一直以来进行的“咳嗽检测阿尔兹海默早期症状”演变而来，疫情以来，研究者通过“网络众筹”的方式，已经在全球搜集了20多万的咳嗽样本，建立了有史以来最大的“咳嗽数据库”。

通过这些咳嗽样本和录入的相关感染、性别、情绪数据，对该模型进行了声音训练。

目前，该模型识别出确诊为Covid-19的人的咳嗽的准确率为98.5％，其中，利用咳嗽声识别无症状感染者的准确度高达100％。

麻省理工的研究小组正在努力将该模型整合到一个用户友好的应用程序中，如果获得FDA的批准并被大规模采用，该程序将有可能成为一种免费、便捷、无创的预筛查工具，以识别可能对Covid-19无症状的人。

用户可以每天登录，录下咳嗽声到他们的手机中，并立即获得有关他们是否可能被感染的信息。

麻省理工学院自动识别实验室的研究科学家布莱恩·苏比拉纳（Brian Subirana）与麻省理工学院自动ID实验室的Jordi Laguarta和Ferran Hueto联合完成了这项研究。

从阿兹海默症检测到新冠检测

其实这项算法并非为新冠定制。

早在疫情爆发之前，这个研究小组已经在咳嗽的手机录音中训练算法，以准确诊断肺炎和哮喘等疾病。麻省理工学院的团队正在以类似的方式开发AI模型，以分析强迫咳嗽记录，以查看它们是否可以检测出阿尔茨海默氏症的体征，这种疾病不仅与记忆力下降有关，而且还与神经肌肉退化（如声带减弱）有关。

他们首先训练了一种通用的机器学习算法或称为ResNet50的神经网络，以区分与不同声带强度相关的声音。研究表明，声音“ mmmm”的质量可以表明一个人的声带有多弱。Subirana在包含了1000多个小时语音的有声读物数据集上训练了神经网络，以从“ the”和“ then”等其他词中挑选出“ them”一词。

该小组训练了第二个神经网络来区分言语中明显的情绪状态，因为已证明阿尔茨海默氏症患者以及神经系统较弱的人表现出某些情绪，例如沮丧或平淡无奇，比他们表达快乐还是冷静的情绪更高。

研究人员通过在大型演员数据集上训练情绪情感分类器（例如中性，平静，快乐和悲伤）来开发情绪语音分类器模型。

然后，研究人员在咳嗽数据库上训练了第三个神经网络，以辨别肺和呼吸功能的变化。

最后，该团队将这三个模型结合在一起，并叠加了一种算法来检测肌肉退化。该算法通过实质上模拟音频蒙版或噪声层，并区分强咳嗽（通过噪声可以听到的咳嗽）与较弱的咳嗽，来做到这一点。

通过新的AI框架，该团队提供了包括阿尔茨海默氏症患者在内的音频记录，发现与现有模型相比，它可以更好地识别阿尔茨海默氏症的样本。

结果表明，声带强度、情绪、肺和呼吸功能以及肌肉退化是诊断该疾病的有效生物标志物。

当冠状病毒大流行开始蔓延时，Subirana想知道他们针对阿尔茨海默氏症的AI框架是否也可以用于诊断Covid-19，因为越来越多的证据表明感染的患者会经历一些类似的神经系统症状，例如暂时性神经肌肉损伤。

“说话和咳嗽的声音都受到声带和周围器官的影响。这意味着当讲话时，部分讲话就像是咳嗽，反之亦然。这也意味着我们很容易从流利的言语中衍生出一些东西，人工智能可以简单地从咳嗽中发现一些信息，包括人的性别、母语甚至情绪状态。实际上，您的咳嗽中蕴含着情感。” Subirana说。

“所以我们认为，为什么我们不尝试探究这些阿兹海默症的生物标志物（以及看它们是否与Covid相关）”。

20万+咳嗽样本，已知最大的咳嗽研究数据集

在4月，研究小组着手收集尽可能多的咳嗽记录，包括来自Covid-19患者的咳嗽记录。

他们建立了一个网站，人们可以通过手机或其他支持网络的设备记录一系列咳嗽。参与者还填写了他们正在经历的症状的调查表，无论他们是否患有Covid-19，是否通过官方测试，通过医生对其症状的评估或是否经过自我诊断而得到了诊断。他们还可以记录自己的性别，地理位置和母语。

迄今为止，研究人员已经收集了70,000多条录音，每条录音包含多个咳嗽声，总计约200,000咳嗽音频样本，Subirana说这是“已知最大的咳嗽研究数据集”。确认患有Covid-19的人（包括无症状的人）提交了大约2500份录音。

该团队使用了2,500个与Covid相关的记录，以及他们从集合中随机选择的另外2500个记录来平衡数据集。他们使用了4,000个样本来训练AI模型。然后将其余的1,000个记录输入模型中，以查看它能否准确区分出Covid患者和健康个体的咳嗽。

令人惊讶的是，正如研究人员在论文中所写的那样，他们的努力揭示了“阿尔茨海默氏症和新冠咳嗽算法之间惊人的相似之处”。

他们发现，在原本用于阿尔茨海默氏症的AI框架内无需进行大量调整，他们就能找到针对Covid-19的四种生物标志物的模式-声带强度、情绪、肺和呼吸功能以及肌肉退化。该模型从Covid-19确诊的人中识别出98.5％的咳嗽，并准确地检测到了所有无症状的咳嗽。

Subirana说：“我们认为这表明，即使您没有症状，当您拥有Covid时，您产生声音的方式也会改变。”

100%检测到无症状感染者

Subirana强调，这种AI模型的优势不在于检测有症状的新冠患者，不管他们的症状是由于Covid-19还是其他症状（如流感或哮喘）引起的。该工具的优势在于它能够分辨无症状新冠感染者的咳嗽和健康的咳嗽。

MIT的团队正在与一家公司合作，根据他们的AI模型开发免费的预检应用程序。他们还与世界各地的多家医院合作，收集更大，更多样化的咳嗽记录集，这将有助于训练和增强模型的准确性。

正如他们在论文中提出的那样，“如果预筛查工具始终在后台并且不断改进，那么泛滥症就可能成为过去。”

最终，他们设想可以将他们开发的音频AI模型集成到智能扬声器和其他听音设备中，以便人们可以方便地（也许每天）对他们的疾病风险进行初步评估。