banner

Блог

Dec 20, 2023

Познакомьтесь с искусственным интеллектом Google

Может ли ИИ работать в обратном направлении от текстового описания, чтобы создать связную песню? Такова идея MusicLM, инструмента для создания музыки на базе искусственного интеллекта, который Google выпустил вчера во время открытия своей конференции I/O.

MusicLM, который прошел обучение на сотнях тысяч часов аудио, чтобы научиться создавать новую музыку в различных стилях, доступен в предварительной версии через приложение Google AI Test Kitchen. Я экспериментировал с ним в течение последнего дня или около того, как и несколько моих коллег.

Вердикт? Скажем так, MusicLM не придет на работу музыкантам в ближайшее время.

Использовать MusicLM в Test Kitchen довольно просто. Как только вам будет одобрен доступ, вас встретит текстовое поле, в котором вы можете ввести описание песни — настолько подробное, насколько захотите — и система сгенерирует две версии песни. Оба трека можно скачать для прослушивания в автономном режиме, но Google рекомендует поставить лайк одному из треков, чтобы улучшить производительность ИИ.

Кредиты изображений:Google

Когда я впервые сделал кавер на MusicLM в январе, еще до его выпуска, я написал, что песни системы звучат примерно так, как мог бы сочинять человек-исполнитель, хотя и не обязательно так музыкально изобретательно или сплоченно. Сейчас я не могу сказать, что полностью поддерживаю эти слова, поскольку кажется очевидным, что с образцами, выпущенными в начале года, происходил серьезный отбор.

Большинство песен, которые я создал с помощью MusicLM, звучат в лучшем случае сносно, а в худшем — как четырехлетний ребенок, выпущенный на DAW. В основном я придерживался EDM, пытаясь создать что-то структурированное и различимое (плюс в идеале приятное) мелодию. Но как бы прилично — даже хорошо! — звучит начало песен MusicLM, наступает момент, когда они обрываются совершенно очевидным, неприятным в музыкальном плане образом.

Например, возьмем этот образец, созданный с использованием подсказки «EDM-песня в легком, оптимистичном и воздушном стиле, подходящая для танцев». Начинается он многообещающе, с головокружительной базовой линии и элементов классического сингла Daft Punk. Но ближе к середине трека он отклоняется от курса — практически другой жанр.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_edm_song_in_a_light_upbeat_and_airy_style_g-2.mp3

Вот соло на фортепиано из более простой подсказки — «романтическая и эмоциональная фортепианная музыка». Как вы заметите, партии звучат хорошо и прекрасно — даже исключительно, по крайней мере, с точки зрения работы пальцев. Но тогда пианистом словно овладевает мания. Дальше путаница нот, и песня принимает радикально иное направление, словно из новых нот — хотя и в духе оригинала.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_romantic_and_emotional_piano_music.mp3

Я попробовал силы MusicLM в чиптюнинге, полагая, что ИИ, возможно, будет легче справляться с песнями более простой конструкции. Никаких кубиков. Результат (ниже), хотя местами и запоминающийся, закончился так же случайно, как и другие образцы.

https://techcrunch.com/wp-content/uploads/2023/05/AI_Test_Kitchen_house_music_in_chiptune_with_an_energetic_ba.mp3

С другой стороны, MusicLM в целом справляется со своей задачей гораздо лучше, чем Jukebox, попытка OpenAI несколько лет назад создать генератор музыки с искусственным интеллектом. В отличие от MusicLM, учитывая жанр, исполнителя и фрагмент текста, Jukebox мог генерировать относительно связную музыку с вокалом, но песням, созданным Jukebox, не хватало типичных музыкальных элементов, таких как повторяющиеся припевы и часто содержащие бессмысленные тексты. Песни, созданные MusicLM, также содержат меньше артефактов и, как правило, кажутся шагом вперед в том, что касается точности воспроизведения.

Кроме того, полезность MusicLM немного ограничена из-за искусственных ограничений в подсказках. Он не будет создавать музыку с участием исполнителей или вокала, даже в стиле конкретных музыкантов. Попробуйте ввести подсказку типа «в духе Барри Манилоу», и вы не получите ничего, кроме сообщения об ошибке.

Кредиты изображений:Google

ДЕЛИТЬСЯ