腾讯警告:你的声音正在被AI 偷走 !
腾讯朱雀实验室
机器之心
音色编码器 :音色编码器从音频中提取不同说话人的语音特征。
文本编码器 :文本编码器将输入文本转换为特征。
解码器 :解码器将说话人特征和文本特征拼接后的结果转化为梅尔声谱图。
语音生成器 :最后语音生成器根据梅尔声谱图合成语音。
![音符](https://filescdn.proginn.com/df9fc578c9e25a4313ab7fd5b47e6d75/b29bf0f2a1b7a55a085a5a23024bcf4f.webp)
评论
腾讯朱雀实验室
机器之心
音色编码器 :音色编码器从音频中提取不同说话人的语音特征。
文本编码器 :文本编码器将输入文本转换为特征。
解码器 :解码器将说话人特征和文本特征拼接后的结果转化为梅尔声谱图。
语音生成器 :最后语音生成器根据梅尔声谱图合成语音。