如何监控实时语音的质量
共 3296字,需浏览 7分钟
·
2021-05-14 05:19
一是其准确性依赖于模型算力,而在产品落地时,因为无法直接改善用户体验,非质量改进的功能的复杂度和包体积要求往往是非常高的;
二是这种方法的鲁棒性在RTE的多场景特性下会受到严格的考验,比如说带有背景音乐或特效的语聊房场景,就会给这种基于深度学习的方法带来很大的挑战。
需要对多种实时互动场景下的语料(音乐/语音/混合)具有鲁棒性,不会出现明显的评估误差。
需要具备多采样率(窄带/宽带/超宽带/全带)的评估能力。
复杂度要足够低,能够在任意设备上对多人通话中对每一路的语音质量进行评估,且不引入明显性能增长。
线上的质量评分能够和线下的测试结果对齐,即同一段通话,该评估方法对当前线上发生的通话的评分,与事后用有参评价方法分析这段通话的得分,两者应该几乎一致。
🎙议题:实时语音质量监控系统的过去、现在和未来
🕰直播时间:5月13日(周四) 晚 8:00
👨🏻💻主讲人:赵晓涵 声网Agora 音频算法工程师
📃演讲内容简介:
1、扫码填写报名表单,报名成功后请注意查收报名成功邮件。
2、我们将会通过邮件给您发送活动群二维码及直播链接。
| 关于声网
声网Agora成立于2013年,是全球实时互动云行业开创者与引领者者。开发者只需简单调用API,30分钟即可在应用内构建多种实时音视频互动场景。声网Agora API 已经赋能社交直播、在线教育、游戏电竞、IoT、AR/VR、金融、保险、医疗、企业协作等10余行业,共计100多种场景。截至2020年12月31日,声网全球注册应用已超27.2万。2020年,声网实时音视频分钟数月均用量超400亿分钟。自成立以来,累计实时音视频分钟数超10,000亿分钟。
点击阅读原文,报名直播