Модель ИИ Riffusion сочиняет музыку на основе визуализаций
Музыка, созданная искусственным интеллектом (ИИ) — это уже достаточно инновационная концепция. Но разработка Riffusion выводит её на новый уровень: создаёт музыку, взяв за пример не звуки, а их изображения.
Diffusion — технология машинного обучения для создания изображений, которая за последний год обогатила мир ИИ. Две самые известные модели — это DALL-E 2 и Stable Diffusion. Метод доказал свою эффективность в разных направлениях и очень удобен для тонкой настройки. То есть обученной модели можно задать вводные, чтобы она создала больше примеров похожего контента.
То, что Сет Форсгрен и Айк Мартирос сделали для своего хобби-проекта Riffusion — это тонкая настройка «Стабильной диффузии» по спектрограммам.
— Сет Форсгрен, разработчик Riffusion.
Спектрограммы — это визуальные отображения звука, которые показывают амплитуду разных частот. Форсгрен и Мартирос приготовили спектрограммы музыки и назвали полученные изображения соответствующе: «блюзовая гитара», «джазовое пианино», «афробит» и тому подобное. После ввода в модель этой коллекции, ИИ «получил представление» о том, как «выглядят» определённые звуки и как их можно воспроизводить или комбинировать.
Модель оказалась способной обрабатывать спектрограммы и выдавать звук, соответствующий подсказкам, таким как «фанковое пианино», «джазовый саксофон» и так далее. В проекте Riffusion обнаружили, что если ИИ задали, например, подсказки «церковные колокола» и «электронные ритмы», программа постепенно и «естественно» переходит от одной к другой, и даже в такт. Получается странный, интересный звук, хотя и не особенно сложный или точный, отметил обозреватель TechCrunch.
Словно оправдываясь, Форсгрен пояснил, что «тренеры» ИИ не пытались создать классическую трёхминутную песню с повторяющимися припевами и куплетами. Для этого, вероятно, нужно построить модель более высокого уровня.
Собственный вывод «Вслух.net» — сайт Riffusion.com получился занятной онлайн-игрушкой для знающих толк в музыке и к тому же интересующихся достижениями ИИ.
Diffusion — технология машинного обучения для создания изображений, которая за последний год обогатила мир ИИ. Две самые известные модели — это DALL-E 2 и Stable Diffusion. Метод доказал свою эффективность в разных направлениях и очень удобен для тонкой настройки. То есть обученной модели можно задать вводные, чтобы она создала больше примеров похожего контента.
То, что Сет Форсгрен и Айк Мартирос сделали для своего хобби-проекта Riffusion — это тонкая настройка «Стабильной диффузии» по спектрограммам.
Мы с Айком играем в небольшой группе. И проект начали просто потому, что любим музыку и не знали, возможно ли вообще в Stable Diffusion использовать спектрограмму для преобразования в звук
— Сет Форсгрен, разработчик Riffusion.
Спектрограммы — это визуальные отображения звука, которые показывают амплитуду разных частот. Форсгрен и Мартирос приготовили спектрограммы музыки и назвали полученные изображения соответствующе: «блюзовая гитара», «джазовое пианино», «афробит» и тому подобное. После ввода в модель этой коллекции, ИИ «получил представление» о том, как «выглядят» определённые звуки и как их можно воспроизводить или комбинировать.
Модель оказалась способной обрабатывать спектрограммы и выдавать звук, соответствующий подсказкам, таким как «фанковое пианино», «джазовый саксофон» и так далее. В проекте Riffusion обнаружили, что если ИИ задали, например, подсказки «церковные колокола» и «электронные ритмы», программа постепенно и «естественно» переходит от одной к другой, и даже в такт. Получается странный, интересный звук, хотя и не особенно сложный или точный, отметил обозреватель TechCrunch.
Словно оправдываясь, Форсгрен пояснил, что «тренеры» ИИ не пытались создать классическую трёхминутную песню с повторяющимися припевами и куплетами. Для этого, вероятно, нужно построить модель более высокого уровня.
Собственный вывод «Вслух.net» — сайт Riffusion.com получился занятной онлайн-игрушкой для знающих толк в музыке и к тому же интересующихся достижениями ИИ.
- Дмитрий Ладыгин
- riffusion.com
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Искали золото в Австралии, а обнаружили следы взрыва тысяч атомных бомб
Почему находка древней катастрофы сильно продвинуло исследование Марса?...
Секреты «русского гена»: о чем молчит гаплогруппа R1a1?
67 общих маркеров ДНК: половина современных русских мужчин и две трети мужчин из высших каст Северной Индии происходят от одного предка. И не только......
Если высохнет Каспий: почему это особенно опасно для России?
Прогнозы пугают: уникальное море-озеро может уменьшиться почти на 40%. И это катастрофа...
Непотушенный окурок взорвал целый город: чудовищная катастрофа и чудовищная ложь в США
Почему власти десятилетиями умалчивали истинную причину самого мощного техногенного ЧП в истории Штатов?...
Третий сын Сталина: родство подтвердил уникальный документ из Красноярского архива
Будущий вождь обещал жениться, но судьба и история оказались против этого брака...
«Код» таинственной золотой подводной сферы наконец-то взломан спустя три года
Ученые говорят: это был настоящий ДНК-детектив. Внеземная «капсула» оказалась «деталью» морского гиганта...
Гениально, многоэтажно и смертельно опасно: как римляне научились строить высотные дома
Почему реальный Древний Рим выглядел вообще не так, как нам показывают в исторических фильмах?...
Почему индейцы — родственники россиян: что нашли в ДНК коренных американцев?
Как связан древний мальчик с Байкала с племенем в Амазонии? Какой подарок от древних людей помог заселить Америку?...
Первый раз настоящий сахар нашли в космосе: почему ученые в восторге?
Чем космический сахар отличается от земного? И почему биологи говорят, что это сенсация?...
Тайный алтарь на развалинах мертвого города майя обнаружили археологи
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...
За что Владимир Ленин трижды выдвигался на Нобелевскую премию?
Почему самая большая «мирная» награда так и не дошла до главного большевика?...
Старше на 500 лет: что скрывает «тестовая модель» Стоунхенджа?
Сначала «тренировались» на дереве, а потом перешли на камень...