人工智能微软小冰出生以来的第一次道歉

[导读] 美国歌手Taryn Southern的新专辑《I AM AI》中,就有一首由人工智能负责编曲,歌手填写歌词的歌曲。虽然这首歌的编曲听起来没有太多亮点,但它的完整度已经很接近人类的创作了。或许在未来,深度学习可以更好的为创作者提供灵感。创作者给出一段旋律,算法就可以为这段旋律渲染上各种不同的风格和感情,以此拓宽思路。

最近,人工智能第一次和人类在小范围爆发了“冲突”,而双方的主角是人见人爱的人工智能少女微软小冰和虚拟歌姬们的粉丝。

虚拟歌姬是二次元中的圈子之一,爱好者们用一款名为Vocaloid的软件,输入歌词和音符,利用音源库中的人声音源和伴奏制作音乐。再搭配上虚拟形象,就变成了初音未来、洛天依这样的虚拟歌姬。

虚拟歌姬初音未来上海演唱会现场

虚拟歌姬初音未来上海演唱会现场

而最近,微软亚洲研究院为微软小冰打造了人工智能歌手深度学习模型,只需要人声清唱一遍,就能学会人类的感情和演唱风格。

在微博上发布关于这一消息时,小冰提到了虚拟歌姬是“过时的技术”等字眼,惹恼了虚拟歌姬粉丝,甚至有些粉丝喊出了让小冰“滚出中国”。

xiaobing02

虽然这件事最终以小冰道歉为结尾,但深度学习和音乐之间的故事在近年来逐渐兴起。

理解音乐,是创造的前提

用算法创造音乐这件事,需要的技术门槛不高,更不需要多大的硬件成本,但真正的难点,却是如何创造出好听的音乐。

xiaobing03

其实在音乐的创作上,最基础的就是七个音符的排列组合,利用随机输入和聚类算法,就能用无规律的音符组合出想要模仿的旋律。

又或者,干脆让电脑把音符随机组合,让人来判断好不好听,最终电脑总会创造出让人满意的旋律。

以上这些方法都存在于“理论中”,音符、乐器、和弦、人声之间可以有无限组合,而音乐类型中既存在通俗歌曲这种规律性较强的,也有爵士乐这种几乎找不到规律的。单纯靠无限组合这种概率事件,恐怕比让猴子打出一部莎士比亚还要难。

这一切的关键就在于,人工智能不能“理解音乐”,如果不能理解,那么只能无意识的模仿和排列组合。而深度学习的加入,让理解音乐这件事成为可能。

再造一个巴赫:庖丁解牛的创作模式

在人工智能理解音乐这件事上,简单地可以参考音乐平台的推荐算法。音乐属于非结构化数据,能够从中识别的标签通常是歌手、出版年份等等信息,或者人为添加上去的歌曲风格。

深度学习让理解音乐更深一步。利用信号分离,提取出音频文件中的分轨(既把人声、器乐等等音乐的不同部分分离出来),就可以学习音乐中和弦、节奏、人声中的规律,更完整的理解音乐。

深度学习作曲最好的案例就是DeepBach,一个2016年诞生于索尼计算机科学实验室的开源项目。

xiaobing04

巴赫创作过大量的复调圣歌(一种包含两条独立旋律的复音音乐)。这种音乐形式极具共同点,同时结构简单,非常适合作为研究对象。

索尼实验室的科学家选择了巴赫的三百多部作品,在一定范围内变调,再利用循环神经网络反复训练。最终训练出来的曲目,几乎可以假乱真。

在演奏时这种“左右互搏”的复调音乐虽然很难,但从结构上来说,复调音乐的特点非常明晰:精准的对位、明显的阶梯感和层次感、更严禁的节奏等等。

严谨、有规律、特点鲜明,也意味着巴赫的复调音乐更容易理解、更容易模仿。说白了,DeepBach创作的音乐谈不上有多高的原创性,只是琢磨透了巴赫复调圣歌的特点,在其原作品形式上进行变化,创作出与之十分相似的音乐。

只会模仿的深度学习

目前大多数人工智能作曲都和DeepBach类似,捕捉音源中的特点,再根据用户的需求对有限的元素进行组合。

Jukedeck、Amper Music等等人工智能作曲平台也是一样,把原本被标注为作者、年份、风格的整首歌曲分解成器乐、节奏等等多个部分,再进行更详细的标注。最后,再根据用户设定的音乐类型、情绪、速度等等“创作”一首歌曲。

Jukedeck音乐创作界面

Jukedeck音乐创作界面

微软小冰虽然不是依靠深度学习直接作曲,但提出的“示唱人”概念,也是收集用户的音准、音高、颤音振幅和颤音频率等等数据,再将这种特征植入到用户制作的歌曲中。

在微软小冰开源之前,我们很难具体了解到小冰如何在十几分钟内通过一段语音,训练出相似的风格和情感。不过几乎可以确定的是,小冰也难以摆脱再创作性远高于原创性的弊端。

所以,音乐人们可以放下心来,你们暂时还不会被AI替代。

是包容侵权者,还是和音乐人好好相处?

虽然利用深度学习创作的音乐没有那么高的原创性,AI也暂时不能替代音乐人,但深度学习却可以帮助音乐人更好的工作,也能给人们带来很多便利。

比如说,当我们想为视频作品、PPT、网页等加入一段配乐时,可以通过Amper Music选择风格,随机创作一段音乐,就可以绕开使用盗版音乐承担的侵权风险。

xiaobing06

又比如说唱音乐的伴奏,通常来自某一首歌的采样,再经编辑而成。这就导致在其他乐迷看来,说唱音乐经常有抄袭的嫌疑。而有了深度学习的存在,创作者可以利用算法学习采样歌曲的风格,而不是直接使用原有旋律。

对于专业音乐人来说,当我们还在担忧他们被人工智能抢走饭碗时,人家已经开始熟练的应用各种人工智能平台进行创作了。

Taryn Southern在2017 TNW大会上做“如何和机器人协作”演讲

Taryn Southern在2017 TNW大会上做“如何和机器人协作”演讲

美国歌手Taryn Southern的新专辑《I AM AI》中,就有一首由人工智能负责编曲,歌手填写歌词的歌曲。虽然这首歌的编曲听起来没有太多亮点,但它的完整度已经很接近人类的创作了。

或许在未来,深度学习可以更好的为创作者提供灵感。创作者给出一段旋律,算法就可以为这段旋律渲染上各种不同的风格和感情,以此拓宽思路。

换个角度想,小冰和虚拟歌姬粉丝间的冲突就是一种预示。现在让我们直接接受人工智能创作歌曲还为时过早,但利用深度学习加持音乐创作的时代已经来临。

不管是Amper还是小冰,又或者是有着众多粉丝的Vocaloid,他们的本质都是工具。工具本身毫无意义,有了人类参与,才能一起创造出整个瑰丽的世界。

未经允许不得转载:数智网 » 人工智能微软小冰出生以来的第一次道歉

分享到: 更多