Nvidia представила ИИ-модель для генерации музыки и звуков

Компания Nvidia представила инновационную ИИ-модель для создания музыки и звуковых эффектов, обладающую уникальными функциями преобразования аудио.

📅 26-11-2024, 13:22 👁️ 93

👤 Андрей Текстов

Фото: forklog

Nvidia продемонстрировала свою новую ИИ-модель, способную генерировать музыку и различные звуки. Среди её возможностей — изменение голосов и создание оригинальных аудиоэффектов.

Технология под названием Fugatto ориентирована на профессионалов из сферы музыки, кино и видеоигр.

При помощи этой нейросети создатели могут генерировать звуковые эффекты и музыкальные композиции по текстовым описаниям, таким как: “аудио, где звучит лающая собака”, или более сложные звуки, например, “глубокие, грохочущие басы с периодическими высокочастотными щебетами, как звук пробуждения огромной разумной машины”.

Одной из ключевых особенностей технологии является её способность анализировать и модифицировать существующие аудиозаписи. К примеру, мелодию, сыгранную на пианино, можно преобразовать в человеческое пение.

«Если мы посмотрим на синтетическую музыку, созданную за последние 50 лет, то увидим, как компьютеры и синтезаторы изменили этот процесс. Я уверен, что генеративные ИИ откроют новые горизонты в музыке, видеоиграх и для обычных людей, желающих создавать что-то новое»,

— Брайан Катандзаро, вице-президент Nvidia по исследованиям в области глубокого обучения

Модель, разработанная компанией на основе открытых данных, готовится к показу широкой общественности.

«Все генеративные технологии несут в себе определённые риски, так как могут быть использованы для создания нежелательных материалов»,

— Брайан Катандзаро

К слову, ранее Google DeepMind также анонсировала создание своей технологии для автоматической генерации музыкальных треков для видео.

Nvidia