У ИИ-группы уже миллион слушателей: как отличить нейросетевую музыку

В июне на зарубежных стримингах появилась рок-группа под названием The Velvet Sundown. Количество ежемесячных слушателей коллектива на Spotify сейчас — 1,1 миллиона человек. Несмотря на «живые» фотографии в профиле и относительно качественное звучание, оказалось, что группа The Velvet Sundown никогда не существовала. Вся музыка и визуал коллектива были созданы с помощью искусственного интеллекта. «Рамблер» поговорил с экспертами музыкальной индустрии и выяснил, как не попасть в эту ловушку и что отличает сгенерированную музыку от творчества настоящих артистов.

У ИИ-группы уже миллион слушателей: как отличить нейросетевую музыку
© Соцсети The Velvet Sundown

На счету The Velvet Sundown уже два альбома: Floating on Echoes и Dust and Silence. Хотя существует группа всего лишь месяц. «Играют» они психоделический рок в стиле семидесятых.

Когда The Velvet Sundown только появились на стримингах, они преподносили себя как обычную группу, а не как продукт искусственного интеллекта. Но всё равно некоторые люди заподозрили неладное, хотя бы из-за быстрой скорости их работы. Журнал Rolling Stone связался с представителем коллектива Эндрю Фрелоном, но тот оказался самозванцем. Это только запутало ситуацию, ведь всё ещё неизвестно, кто стоит за созданием The Velvet Sundown.

Были и более весомые доказательства, что песни группы были созданы нейросетями. Например, стриминг Deezer пометил их лонгплеи сообщением: «Некоторые треки в этом альбоме, возможно, были созданы с использованием искусственного интеллекта». Платформе удалось это обнаружить благодаря новой технологии. А издание Music Ally обратилось к технологической компании Ircam Amplify, которая в прошлом году представила инструмент, который распознаёт сгенерированную музыку с точностью 98,5%. Результаты показали, что 10 из 13 треков с альбома Dust and Silence точно были созданы ИИ. Помимо этого, компания сделала выводы, что для этого использовалась программа Suno.

Спустя месяц после дебюта создатель группы открыто признал, что она была сгенерирована искусственным интеллектом. На стримингах появилось такое описание:

The Velvet Sundown — это синтетический музыкальный проект под творческим руководством человека, созданный, озвученный и визуализированный при поддержке искусственного интеллекта.
Это не трюк — это зеркало. Продолжающаяся художественная провокация, призванная бросить вызов границам авторства, идентичности и будущему самой музыки в эпоху искусственного интеллекта.

Музыкальный эксперт и экс-главред российского журнала Rolling Stone Александр Кондуков в беседе с «Рамблером» обратил внимание, что непонятно, каким образом The Velvet Sundown набрали первых 500 тысяч слушателей. Благодаря им на группу и обратили внимание.

Сейчас ситуация широко обсуждается, и это может привести к скандалу, связанному с накруткой слушателей. Кроме того, нельзя исключать, что за AI-группой стоит непосредственно Suno — сервис по созданию музыки. Стоит достать попкорн и дождаться профессиональных разборов от музыкантов, у которых The Velvet Sundown будет отбирать хлеб, — типа Дэна Ауэрбаха из The Black Keys. Они могут детально разобрать и проанализировать продукт с музыкальной точки зрения.

Александр Кондуков
Александр Кондуковмузыкальный и киноэксперт

Как понять, что музыка была сгенерирована нейросетью

© Freepik

Продюсер и композитор Константин Корсаков (Dean Korso) рассказал «Рамблеру», что на современном этапе развития технологий специалист может выявить музыку, созданную с помощью искусственного интеллекта. Тем более сейчас существуют способы более детальной проверки.

В программах вроде Logic Pro или iZotope RX можно разделить музыку на стемы, то есть на её составляющие. Эти стемы можно транспонировать, растягивать или как-то ещё изменять. В музыке, которая была сделана нейросетями, сразу же возникает огромное количество артефактов. То есть все эти партии звучат странно, по-пластиковому.

Константин Корсаков (Dean Korso)
Константин Корсаков (Dean Korso)продюсер, композитор

Корсаков также считает, что человек, у которого есть наслушанность в этой области, может сразу же услышать сгенерированную музыку. Это связано не только с качеством звучания, но и с конструкцией песни. Чаще всего ходы, которые использует нейросеть, очень узнаваемы.

Нейросети — это просто сложные алгоритмы, которые компилируют огромное количество источников. К тому же учатся они не на самом качественном материале, поэтому и результат соответствующий.

Константин Корсаков (Dean Korso)
Константин Корсаков (Dean Korso)продюсер, композитор

Александр Кондуков тоже уверен, что определить такого рода музыку можно, но с трудом. Если обратиться к примеру с группой The Velvet Sundown, то в первую очередь людей смутили фото артистов и обложки альбомов и только потом — музыка.

По мнению Кондукова, нейросеть научилась делать саунд-дизайн, но с ритм-секцией у неё всё ещё проблемы, «как с пальцами в программах ИИ-рисования».

The Velvet Sundown — это гладкий фолк-рок, который звучит излишне рафинированно и неэмоционально. Раньше подобным были забиты каталоги продакшен-музыки, откуда создатели звуковых дорожек брали музыку для оформления кусочков сериалов — например, бессмысленного проезда на машине, который тянет время и экономит деньги. Теперь экономия будет ещё значительнее.

Александр Кондуков
Александр Кондуковмузыкальный и киноэксперт

Будущее музыки и нейросетей

© Freepik

Александр Кондуков считает, что в поп-музыке исполнители вроде The Velvet Sundown не будут особо популярны, потому что фанатов во многом привлекает личность самого артиста.

Как показывает практика, сектантские группировки, которые поддерживают конкретных артистов — типа Тейлор Свифт и Сабрины Карпентер — в первую очередь интересуются историей артиста. Его биография, победы и поражения находят эмоциональный отклик вместе с музыкой. Это часть общего продукта. За контентом, на мой взгляд, должна стоять жизнь.

Александр Кондуков
Александр Кондуковмузыкальный и киноэксперт

Константин Корсаков отметил, что артисты, сгенерированные в соцсетях, могут даже оказаться под волной хейта. В пример он привёл искусственную певицу TaTa, которую создал рэпер и продюсер Тимбалэнд вместе с программой Suno. Многие посчитали, что продвижение таких исполнителей несправедливо по отношению к талантливым музыкантам, которые тратят годы на образование, получение навыков и попытки быть услышанными.

Корсаков добавил, что негативное отношение складывается не только к нейросетевой музыке, но и к визуальному контенту, созданному ИИ, например с помощью программы Midjourney.

Вначале это выглядело экстраординарно и действительно таким и являлось. Сейчас происходит девальвация ИИ-продуктов, потому что, чем проще производство, тем ниже ценность конечного результата. Представьте, если все предметы станут золотыми, то золото моментально потеряет свою стоимость.

Константин Корсаков (Dean Korso)
Константин Корсаков (Dean Korso)продюсер, композитор

При этом Корсаков не отрицает, что нейросети могут быть очень полезны. Есть большое количество программ, которые помогают разгрузить рутинную часть работы, убыстрить процесс. К тому же иногда результат, выданный ИИ, может натолкнуть на интересную идею.

В будущем, по мнению Константина Корсакова, вопрос, связанный с использованием ИИ, будет отрегулирован тщательнее. Например, уже сейчас стриминг Spotify отправляет массу судебных исков композиторам, которые недобросовестно загружают на платформу сгенерированную музыку, выдавая за свою.

Я думаю, что со временем музыка, созданная ИИ, просто займёт отдельную нишу. В ней будут свои чарты, жанры и даже, возможно, герои. Музыка, сделанная человеком, будет стоять отдельно. Понятно, что на пересечении будет возникать сумеречная зона, когда одни будут выдавать себя за других. Но это дух времени, с ним ничего не поделаешь.

Константин Корсаков (Dean Korso)
Константин Корсаков (Dean Korso)продюсер, композитор

Татьяна Куртукова, Xolidayboy и другие предсказали, как ИИ повлияет на музыку