米兰大学发布论文与猫咪叫声数据集，分类喵喵叫-技术圈

来源：HyperAI超神经

本文约1000字，建议阅读5分钟 
米兰大学计算机系的研究团队，试图用隐式马尔科夫方法将猫咪在不同环境状态下的喵喵叫识别出来，他们还真的成功了。

关键词：声音识别动物AI 机器学习深度学习

米兰大学的研究团队在期刊《动物福利》上发布了论文《猫在不同环境中叫声的自动分类》。

他们通过音频信号处理和模式识别算法，实现了对猫叫声的自动分类。此外，团队还开放了一个包含 440 段由 21 只猫收集的叫声数据集。

收集二十一只猫，在三种状态的喵喵叫

猫，一直以来都是最受欢迎和喜爱的家庭宠物之一，通过对它们的行为、各类研究加强对猫的全面了解。

研究团队展开的这项研究，希望能够找出猫在几个常见环境下的叫声是否存在共性和规律，能通过机器学习的方式，找到这些规律，以了解猫的行为意图或心理活动。

他们选择了 10 只缅因猫和 11 只英国短毛猫两个品种共二十一只猫，仔细记录下它们的性别、绝育情况。

英国短毛猫-蓝猫（左图）和缅因猫（右图）

喵喵叫数据集

发布机构：米兰大学计算机系

包含数量：440 段音频

数据格式：wav

数据大小：20 MB

下载地址：

https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/

数据集收录了它们三种环境状态下的叫声，分别是：被抚摸时、陌生环境、喂食前，并严格保证每只猫在三种环境中的各种变量。

比如在收录猫咪在陌生环境中的叫声前，会让主人陪伴猫咪在环境中共处至少 30 分钟，以免激发它们的情绪波动。在保证猫咪情绪稳定后，主人离开当前环境，收录猫咪独处的十分钟里的叫声。

在数据收集过程中，还需要尽量减少房屋、家具装饰等对收音的影响，团队还测试了各种收音设备，包括宠物穿戴设备，确保收音质量。

图为受试猫猫佩戴研究团队挑选的收音设备

基于声音文件，研究团队提取了两组声学参数，即梅尔频率倒谱系数（MFCC）和时序特征。用这些参数使用基于有向无环图等分类方案，将问题空间进行分类。

研究团队共使用了五种分类方案：DAG-HMM（有向无环图-隐式马尔科夫）、class-specific HMMs, universal HMM 、SVM 支持向量机和ESN 回声状态网络（Echo State Network ）五种分类方法。

实验结果发现 DAG-HMM（有向无环图-隐式马尔科夫）的识别效果最佳。DAG-HMM 对三种状态的分类识别效果，如下：

结果显示 GAG-HMM 方法对三种状态的猫叫声，都有着很高的识别率。尤其对于等待喂食状态下的声音，有着 100% 的准确识别率。

这一研究结果让团队大受鼓舞，实验证明了猫叫声是可以被有效分类的。他们计划下一步的研究将尝试结合猫咪的身体动作，建立分析模型，继续分析猫咪的情绪特征。

读论文，下载数据集，就能理解猫？

论文访问

https://www.mdpi.com/2076-2615/9/8/543/htm

进行阅读

数据集访问

https://openbayes.com/console/openbayes/datasets/cxuvZ3QDu2S/

注册后下载

点击原文阅读访问数据集下载页

动物的表达体系十分复杂，声音只是其语言的一部分，绝大多数动物还会依靠肢体动作、气味甚至生物激素，进行彼此之间的交流。

所以，要想搞懂它们的情绪，人工智能的确有办法。但是我们建议主人在养育过程中，多多用心关注小主子的表现与反应，更能体会到它们真实的情绪和需求噢~

编辑：于腾凯