AI

Open AI 发布 MuseNet,数秒生成不同风格的原创音乐

下一篇文章

美国抨击阿里巴巴与拼多多销售假货

如果有一首钢琴和竖琴协奏曲兼具莫扎特(Mozart)和凯蒂·佩里(Katy Perry)的风格,你想听吗?好吧,为什么不呢?因为你现在可以做到,只需要使用 OpenAI 的最新成果 MuseNet。这是一个机器学习模型,它可以基于对艺术家的了解以及几段现有的音乐小节生成前所未有的原创音乐(万幸这不会导致人类毁灭)。

这倒不算什么新鲜事物(计算机生成音乐早在几十年前就有了),但 OpenAI 的方法似乎具有灵活性和可扩展性,它可以生成各种类型和各种艺术家风格的音乐,并进行相互融合,形成新的风格。MuseNet 跟 OpenAI 的文本生成模型 GPT2 有着很多相同的基因,后者号称 “太过危险,不适宜发布”。不过,跟计算机生成真假难辨的假新闻比起来,计算机不受限制地生成音乐危险性似乎要小一些。

研究人员利用数十位艺术家的作品对 MuseNet 进行了训练,其中有肖邦(Chopin)和巴赫(Bach)那样的著名历史人物,也有阿黛尔(Adele)和披头士(The Beatles)这样的现代艺术家,此外还有来自非洲、阿拉伯和印度地区的音乐作品。MuseNet 的复杂机器学习系统在模型用来为其下一步创作提供信息的上下文关系上投注了大量的 “注意力”(attention,这是人工智能领域的一个技术术语)。

以莫扎特的作品为例,如果模型每次只 “注意” 其中的几秒钟,那么它就无法学习交响乐更庞杂的音乐结构,无法注意到其中的起伏以及音调和乐器的变化。然而,研究人员赋予了 MuseNet 足够大的虚拟脑空间,让它可以留存 4 分钟左右的声音,足以理解掌握一首拥有缓慢前奏和华丽收尾的乐曲或是基本的 “主-副-主” 结构。

你说仙妮亚(Shania)没有受到来自海顿(Haydn)Haydn 的直接影响?醒醒吧。

你说仙妮亚(Shania)没有受到来自海顿(Haydn)Haydn 的直接影响?醒醒吧。

从理论上讲,情况是这样。MuseNet 并不真的理解音乐理论,只是能够对音符的排列做出判断:这个音符要接在这里,那个音符要放在那类和弦的后面。这些作品的结构是基础性的,但在聆听的时候,我们能够很清楚地听出它们的确成功地模仿了之前馈入模型的音乐。

MuseNet 令人印象深刻的地方在于,作为单一模型,它能跨越多种音乐类型做到这一点。此前,AI 已经能够生成以特定艺术家或类别为主题的作品,就像几周前谷歌为纪念巴赫诞辰发布的 AI 涂鸦,它可以利用机器学习技术生成巴赫风格的音乐。作为比较,我一直在听 Generative.fm 上的白噪音,我非常喜欢一边工作一边聆听该网站用机器生成的背景音乐(如果你也喜欢这样,那么我要向你介绍一下我最喜欢的音乐厂牌之一:Serein)。不过,这两种模型生成的音乐在风格上都存在非常严格的限制,MuseNet 没有这个问题。

除了能够不受限制地生成蓝草音乐或巴洛克风格钢琴曲之外,MuseNet 还能通过一个风格转换过程将两者的特征结合起来。一件艺术作品的不同部分可能拥有不同的特性:在绘画中,那是指构图、主题、色彩选择以及笔触。想象这样一幅画作,它有着前拉斐尔派的主题和构图,但却是用印象派的技法画出来。听上去很有趣,对吗?AI 模型很擅长做这样的事,因为它们能够将这些不同的方面区分开来。这同样适用于音乐作品:一首流行歌曲的音符排列、节奏和其他模式可以被分别抽取出来,然后独立于演奏乐器进行调用——为何不用竖琴来发出海滩男孩(The Beach Boys)的和声?

然而,模型没有阿黛尔的烟熏嗓,要呈现这位歌手给人的感觉就有点难,而且 Muse 团队选择的合成器非常基础,这也让作品的整体效果打了折扣。在收听了一小段该团队通过 Twitch 发布的 “现场音乐会” 之后,我不太相信 MuseNet 能够成为下一个热门音乐创作者。另一方面,这个模型经常能够奏出美妙的旋律,尤其是在爵士乐和古典音乐的即兴创作中,在这里一点点跑调无伤大雅,而音乐的节奏也不让人感觉那么做作。

MuseNet 能用来做什么呢?事实上,没有人能够确定。这个领域是全新的,MuseNet 项目的负责人克里斯汀·佩恩(Christine Payne)对这个模型感到很满意,她已经为其找到了一些使用者:

作为一个接受过古典音乐训练的钢琴演奏者,看到 MuseNet 能够理解贝多芬和肖邦音乐作品中复杂的谐波结构,我感到特别兴奋。目前,我正在跟一位作曲家合作,他打算将 MuseNet 融入自己的音乐创作当中,我很想要看一看人类和 AI 的联合创作将把我们引向何方。

OpenAI 的一位代表还表示,MuseNet 团队已经开始在模型中整合当代作曲家的作品,这些人希望看一看 MuseNet 是如何解读或模仿他们个人风格的。

OpenAI 将开放 MuseNet 供大家试用直至 5 月中旬,届时他们会将这个模型下线,并根据用户的反馈意见进行调整。不久(大概是数周)之后,Muse 至少会实现部分开源。我想啊,受到大家欢迎的风格组合以及那些人们一直在听的音乐作品将在调整之后获得更大的权重。在这里,我希望 MuseNet 团队能够在 MIDI 的实现上增添更多的表现力,目前的这些作品的确像是由机器人演奏出来的。不过,这些作品也是 OpenAI 工作质量的明证,它们很多都非常好听。

图片来源:enjoynz / Getty Images

翻译:王灿均(@何无鱼

MuseNet generates original songs in seconds, from Bollywood to Bach (or both)