Как инженеры научили ИИ петь голосом любого артиста
Китайская система искусственного интеллекта Lingyin Engine, по заявлениям ее создателей, исполнила уже более 1000 песен, имитируя голоса живых и уже умерших исполнителей. О том, какие последствия для музыкальной индустрии может нести эта разработка, рассказывает научный обозреватель Николай Гринько. Представители китайской стриминговой платформы Tencent Music Entertainment (TME) рассказали, что инженеры компании вот уже несколько месяцев разрабатывают систему голосового синтеза, способную имитировать голос и манеру исполнения любого певца. Результаты работы нейросети впечатляют: песни, записанные с помощью алгоритма, набирают десятки тысяч прослушиваний, а одна из них стала настоящим хитом, заработав 100 миллионов просмотров и 350 000 долларов. Схему работы этого сложного ИИ (как и большинства нейросетей) можно описать довольно просто: программа обучается на множестве записей какого-либо певца, анализирует его тембр, нюансы и особенности пения, а затем "поет" его голосом любой загруженный текст на предложенную ей мелодию. В теории, нейросеть может исполнять стихи Пушкина на музыку Майкла Джексона голосом Леонида Утесова – никаких ограничений нет. Но TME запатентовала эту технологию, ограничила доступ к ней и теперь буквально сотнями выпускает треки с голосами звезд китайской эстрады – как здравствующих, так и ушедших. Причем, судя по всему, никаких юридических оснований у компании нет, никаких авторских прав на голоса TME не приобретала. Сообщение вызвало панику среди исполнителей, осознавших, что они могут потерять доходы и карьеру. В самом деле, если нейросеть может имитировать голос, например, Эда Ширана, то ничто не мешает ее владельцам уже завтра выпустить "новый альбом" этого певца, а то и не один. Правда, стоит учесть, что Lingyin Engine имитирует только голос, сочинять мелодии и слова песен она не умеет – этим занимаются живые люди, которых наняла TME. С другой стороны, многие системы искусственного интеллекта уже довольно успешно выступают в роли композиторов и поэтов. Если копнуть поглубже, то можно вспомнить, что музыку сегодня невозможно создать без аранжировщиков и звукоинженеров, но и с этими обязанностями нейросети скоро научатся справляться. А значит, не за горами времена, когда на человечество обрушится цунами из миллионов поп-хитов, сгенерированных по нажатию кнопки. Не удивительно, что деятели шоу-бизнеса очень сильно нервничают. К сожалению, ничего утешительного для музыкантов мы сказать не можем. Lingyin Engine – это только первая ласточка, и в самое ближайшее время песни, написанные искусственным интеллектом, станут мейнстримом и займут верхние строчки в чартах. Это неизбежно. Очень быстро придет время сгенерированной музыки, и никакой другой почти не останется. Стриминговые сервисы, которые сегодня подбирают плей-листы под настроение из существующих треков, уже лет через пять будут на ходу сочинять для вас песни, не существовавшие до этого момента. Кинокомпозиторы останутся без работы, поскольку режиссеру будет достаточно скомандовать компьютеру: "Здесь нужна музыка с нарастающей тревожностью, сыгранная на скрипках, виолончели и трех железных ведрах", чтобы уже через секунду получать требуемую звуковую дорожку. Музыкальные радиостанции и телеканалы исчезнут, поскольку ежедневно будут появляться и исчезать миллионы новых песен, и не будет никакого смысла транслировать их в эфире. Музыку ждут времена потрясений. Согласитесь, все это выглядит немного пугающе. Чтобы подсластить пилюлю, можем лишь сказать, что довольно скоро эта мода пройдет, и "искусственные" треки – нет, не исчезнут, а станут всего лишь еще одним музыкальным направлением, таким же, как остальные. Во времена первых электронных синтезаторов многие всерьез полагали, что живые инструменты доживают последние дни. В эпоху диско музыкальные критики предрекали скорую смерть року. Когда появился дабстеп, казалось, что музыка скоро вообще исчезнет. Но ничего такого не произошло: консерватории все еще существуют, волосатые гитаристы играют хэви-метал, а рэперы не смогли вытеснить со сцены даже гармонистов. Музыка, созданная нейросетями, в итоге просто пополнит длинный список жанров и направлений. Мода на нее захлестнет весь мир, но очень быстро спадет – точно так же, как любая другая. Хотя...