音乐AI工具:作曲混音编曲都OK!留给人类发挥的空间不多了
共 2055字,需浏览 5分钟
·
2022-01-14 23:09
点击下方“AI算法与图像处理”,一起进步!
重磅干货,第一时间送达
来源:量子位
在AI们还在某个特定领域学画画、学写歌的时候,索尼已经喊了一群AI来给音乐人做全能助手了!
包含从鼓点、贝斯、钢琴伴奏的生成,到多音轨的混合,再到母带制作等多项功能的那种。
可以说,创作音乐的全程都有AI的参与。
而这些AI们单拎出来也都是优秀的“唱作人”,自己也可以创作新的旋律、节奏或和声样本:
用索尼的话来说,这种AI合成的音乐样本其实是提供了一种“创意原型”,能够让音乐家仿佛在与多名制作人一起头脑风暴,探讨新的音乐创意。
而这全套音乐辅助工具,总共包含了六大创造性AI,和四大专业的音频制作工具。
这时候,就不得不再喊出那句话:
AI辅助音乐创作
首先是创造性的AI工具,这些工具某种程度上是将“音乐创新”这件事流水线化了。
其中,DrumNet通过无监督学习的方式从音乐数据集之间生成一种音乐与鼓点之间的期望关系,进而形成一种可以直接基于现有的音乐旋律生成鼓点节奏的AI。
BassNet则是基于现有音乐旋律生成低音的AI,并且在音乐播放时可以随时调整和控制产生音符的密度、清晰度和音色。
Flow Machines可以生成一段包含和弦、低音和完整旋律的音轨样式。
在把实际演奏的钢琴旋律进行数字化处理时,常常会遇到一些音符的缺失,这时就可以用PIA进行“修复”,甚至还可以直接去“续写”或者从头创建一段新的旋律。
这就相当于让用户扮演了艺术总监的角色,只需要验证或否决AI创造出来的作品是否足够让人满意。
剩下的两个AI中,NOTONO可以直接用复制粘贴来添加不同的音色,是一个将声音可视化的合成器。
而DrumGAN则是我们熟悉的GAN,用于生成各种各样的鼓声。
接下来是专业性的工具。
Profile EQ类似拥有“自动对比”功能的图形编辑器,是一个能将音频直观对比的自适应均衡器。
Resonance EQ则拥有类似“调节图像饱和度”的功能,能对音频也进行类似的调节:比如平滑音频,去掉杂音,或放大共鸣,强调谐波丰富旋律。
Multiband Phase是一个可以自动识别和修复相位相关问题的工具,XSpecMatch则是一个实时的音频匹配均衡器。
AI无法代替艺术创造
其实,这种AI与艺术创作的碰撞在最近几年愈发频繁。
比如在去年年初,科研机构Space150模仿说唱歌手Travis Scott的人声和音乐风格,基于AI技术做出了一个说唱机器人Travis Bott。
而这位Travis Bott真的创作了一首名为《Jack Park Canny Dope Man》的歌,歌词和旋律均由自己完成。
虽然有不少网友看着MV表示“比真人还好”,“非常有趣,这仅仅是个开始”,表示如果这位歌手开演唱会自己一定会买票去看。
但也有人产生了这样的担忧:
仿佛在看《黑镜》中的一集。
事实上,每当AI在艺术创造领域有了新的应用时,都能引发无数的思考和争论。
人们在惊叹AI创作力与日俱增,甚至于人类无异的同时,也在担心AI是否会进一步蚕食掉创作领域中的艺术家们的工作。
对于这种问题,开发了上述全套AI辅助工具的Sony CSL实验室是这样说的:
艺术家不是深度学习的专家,因此,我们要将技术嵌入到艺术家的工作流,让人工智能更好地辅助他们进行创作。
秉持着这一目标,该实验室在巴黎的分部Sony CSL Paris已经在理解和创造音乐、语言等多个具有艺术创造力的领域,通过AI和数据科学发表了多篇论文,开发了不少应用。
而一些音乐人也表示,AI在艺术创作领域的高速发展或许会使一些创作者受到挑战,比如在音乐圈从事重复劳动工作,创作口水歌、套路化背景乐的音乐人。
但是,AI永远不会替代核心创作者,还会把从业者像更核心、更创意化个性化、更具有艺术价值的方向推动。
参考链接:
https://cslmusicteam.sony.fr/prototypes/
交流群
欢迎加入公众号读者群一起和同行交流,目前有美颜、三维视觉、计算摄影、检测、分割、识别、NeRF、GAN、算法竞赛等微信群
个人微信(如果没有备注不拉群!) 请注明:地区+学校/企业+研究方向+昵称
下载1:何恺明顶会分享
在「AI算法与图像处理」公众号后台回复:何恺明,即可下载。总共有6份PDF,涉及 ResNet、Mask RCNN等经典工作的总结分析
下载2:终身受益的编程指南:Google编程风格指南
在「AI算法与图像处理」公众号后台回复:c++,即可下载。历经十年考验,最权威的编程规范!
下载3 CVPR2021 在「AI算法与图像处理」公众号后台回复:CVPR,即可下载1467篇CVPR 2020论文 和 CVPR 2021 最新论文