В России обновили компьютерного «художника» Kandinsky
Новая генеративная модель Kandinsky 2.1 способна всего за несколько секунд создавать высококачественные изображения по их текстовому описанию.
• умеет рисовать в различных стилях;
• может смешивать несколько рисунков;
• изменяет рисунки по текстовому описанию;
• генерирует изображения, похожие на заданное;
• Дорисовывает недостающие части картинки;
• формирует изображения в режиме бесконечного полотна (inpainting/outpainting);
• понимает запросы на 101 языке.
Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices. Sber AI — подразделение Сбера, отвечающее за развитие технологий искусственного интеллекта (ИИ) и их внедрение в различные сферы жизни и бизнеса.
В обновлённой нейросети кардинально улучшили генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.
Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели.
Модель умеет визуализировать любой контент и может применяться в различных отраслях.
— Александр Ведяхин, первый зампредседателя правления Сбербанка.

Наша редакция протестировала обновленную нейросеть и мы считаем, что она, мягко говоря, далека от совершенства. В отличие от большинства нейросетей, Kandinsky так и не научили считать пальцы. На иллюстрации сгенерированное по запросу «В России обновили компьютерного „художника“ Kandinsky» изображение.
Оценить возможности нейросети можно, в том числе, на промостранице модели, в мобильном приложении Салют и на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Модель также доступна для использования на платформе Fusion Brain и в телеграм-боте.
Возможности Kandinsky 2.1:
• умеет рисовать в различных стилях;
• может смешивать несколько рисунков;
• изменяет рисунки по текстовому описанию;
• генерирует изображения, похожие на заданное;
• Дорисовывает недостающие части картинки;
• формирует изображения в режиме бесконечного полотна (inpainting/outpainting);
• понимает запросы на 101 языке.
Нейросеть разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices. Sber AI — подразделение Сбера, отвечающее за развитие технологий искусственного интеллекта (ИИ) и их внедрение в различные сферы жизни и бизнеса.
В обновлённой нейросети кардинально улучшили генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо 2 млрд в Kandinsky 2.0.
Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подаёт его на вход основной генеративной модели.
Модель умеет визуализировать любой контент и может применяться в различных отраслях.
По сути, это ещё один важный шаг к AGI — сильному искусственному интеллекту. Думаю, у каждого найдётся задача для Kandinsky 2.1, и поэтому улучшенная модель, как и её предыдущая версия, находится в открытом доступе: протестировать её может любой желающий, причём бесплатно
— Александр Ведяхин, первый зампредседателя правления Сбербанка.

Наша редакция протестировала обновленную нейросеть и мы считаем, что она, мягко говоря, далека от совершенства. В отличие от большинства нейросетей, Kandinsky так и не научили считать пальцы. На иллюстрации сгенерированное по запросу «В России обновили компьютерного „художника“ Kandinsky» изображение.
Оценить возможности нейросети можно, в том числе, на промостранице модели, в мобильном приложении Салют и на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Модель также доступна для использования на платформе Fusion Brain и в телеграм-боте.
- Дмитрий Ладыгин
- sberbank.ru
Наши новостные каналы
Подписывайтесь и будьте в курсе свежих новостей и важнейших событиях дня.
Рекомендуем для вас
Третье пророчество китайского Нострадамуса: почему Иран победит США
Два предсказания уже сбылось, когда ждать исполнения третьего прогноза...
7000-летняя загадка: полный ров обезглавленных скелетов обнаружен в Словакии
Археологи в растерянности: совершенно непонятно, кто и зачем изъял черепа у 77 человек...
Обломок взорвавшейся планеты размером с Луну нашли в самом сердце Сахары
Откуда он там взялся и что вообще творилось на заре существования Солнечной системы?...
МКС снова переехала: почему в этом «виноваты» русские?
Без российских кораблей международная станция давно бы упала и сгорела...
5000 лет исторической тайны: кто жил на Дону до славян, рассказали археологи
95 образцов, 11 курганов, 10 стоянок полностью переписали прежнюю хронологию...
Тайны «северной столицы»: чем поразил археологов главный город гуннов?
Этот мегаполис вообще не должен был существовать, так как нарушает все правила...
Жизнью мы обязаны Юпитеру: почему эта планета отметилась в ДНК каждого из нас?
Американские ученые полностью переписали одну из главных страниц в истории Земли...
Боевые комары Пентагона: детали секретного проекта наконец-то раскрыты
Почему эксперты признают: у этих экспериментов был большой потенциал?...
Третий сын Сталина: родство подтвердил уникальный документ из Красноярского архива
Будущий вождь обещал жениться, но судьба и история оказались против этого брака...
Тайна аномальных снегопадов в Антарктиде раскрыта: виноваты невидимые «реки»
Ученым придется пересмотреть все климатические модели Шестого континента. Кстати, снега там будет выпадать с каждым годом все больше...
Тайный алтарь на развалинах мертвого города майя обнаружили археологи
Выяснилось, что индейцы долгие столетия продолжали исповедовать, казалось бы, давно забытый древний культ...