Nvidia представила ИИ-модель для генерации музыки и звуков
Компания Nvidia представила инновационную ИИ-модель для создания музыки и звуковых эффектов, обладающую уникальными функциями преобразования аудио.
Nvidia продемонстрировала свою новую ИИ-модель, способную генерировать музыку и различные звуки. Среди её возможностей — изменение голосов и создание оригинальных аудиоэффектов.
Технология под названием Fugatto ориентирована на профессионалов из сферы музыки, кино и видеоигр.
При помощи этой нейросети создатели могут генерировать звуковые эффекты и музыкальные композиции по текстовым описаниям, таким как: “аудио, где звучит лающая собака”, или более сложные звуки, например, “глубокие, грохочущие басы с периодическими высокочастотными щебетами, как звук пробуждения огромной разумной машины”.
Одной из ключевых особенностей технологии является её способность анализировать и модифицировать существующие аудиозаписи. К примеру, мелодию, сыгранную на пианино, можно преобразовать в человеческое пение.
«Если мы посмотрим на синтетическую музыку, созданную за последние 50 лет, то увидим, как компьютеры и синтезаторы изменили этот процесс. Я уверен, что генеративные ИИ откроют новые горизонты в музыке, видеоиграх и для обычных людей, желающих создавать что-то новое»,
Модель, разработанная компанией на основе открытых данных, готовится к показу широкой общественности.
«Все генеративные технологии несут в себе определённые риски, так как могут быть использованы для создания нежелательных материалов»,
К слову, ранее Google DeepMind также анонсировала создание своей технологии для автоматической генерации музыкальных треков для видео.