Дайджест

Сбер представил новую версию нейросети Kandinsky 3.0

22 ноября 2023, 21:16

Kandinsky 3.0 – принципиально новая версия нейросети для творчества. Такая генеративная модель уже усовершенствована, и именно она была представлена на конференции Сбера, посвящённой машинному изучения и ИИ. Данное мероприятие продлится до 24 ноября.

Те, кто впервые увидел новую версию Kandinsky 3.0, отметили, что она по сравнению с предшествующими гораздо эффективнее распознаёт текстовые запросы, а потому и изображения в итоге создаются более реалистичные, вплоть до полноценных картин и артов. Именно эта модель активно работает с широким перечнем запросов, а значит, реализует практически любую, даже самую безумную идею.

Kandinsky 3.0 в новом исполнении способен распознавать большинство элементов культурного кода отечественного происхождения. Таким образом, используя ИИ, удаётся генерировать российских и советских личностей, архитектурные достопримечательности, объекты культуры и народного творчества. Более плодотворно работает также функция редактирования изображений, благодаря ей можно выполнять различной сложности зарисовки в режиме бесконечного полотна.

Что касается разрешения изображений, создаваемых Kandinsky 3.0, то оно получается достаточно высоким, однако соотношение сторон можно подобрать по желанию. Для того чтобы обучить данную нейросеть, разработчики специально использовали новый датасет на 1,5 млрд пар «текст-изображение», в котором содержатся сведения, предварительно подвергшиеся многократной фильтрации. Как результат – качество генераций улучшилось в разы.

На данный момент пользователям нейросети Kandinsky 3.0 предоставляется уникальная возможность по созданию эффектных видеороликов в соответствии с текстовым описанием в режиме анимации. Частота видео составляет 24 кадра в секунду, ролики рассчитаны на 4 секунды каждый. На то, чтобы синтезировать 1 секунду, уходит примерно 1 секунд, однако возможности базовой модели вполне можно и расширить при необходимости, для чего разработчики использовали различные типы анимаций, тем самым объекты реалистично перемещаются в разные стороны, приближаются и отдаляются, статику же нейросеть оживляет, используя все те способы, что изначально ей доступны.

Запросы для ИИ Kandinsky 3.0 можно делать более, чем на 100 языках мира, а пользователи подобным образом создают качественные изображения в неограниченных количествах, выбирая наиболее подходящие стили для каждой конкретной ситуации. Разработкой и обучением данной модели занимались исследователи Sber AI совместно с представителями компании SberDevices.

Александр Ведяхин, первый заместитель Председателя Правления Сбербанка:

«Технологии искусственного интеллекта могут наделить человека супервозможностями. Kandinsky — один из инструментов, предоставляющих такие возможности. Это удобная, функциональная и бесплатная нейросеть Сбера для творчества. Мы постоянно работаем над её усовершенствованием. Новая версия модели ещё лучше понимает запросы от пользователей, научилась разбираться в тонкостях русской культуры и народного творчества. Пробуйте, творите, создавайте уникальные художественные произведения, которые могут стать подарком или украсят вашу коллекцию».

Уже сегодня рядовым пользователям доступна нейросеть и все её возможности, достаточно обратиться на специализированную платформу fusionbrain.ai. Аналогично она же представлена в Telegram- и в VK-ботах, на сайте rudalle.ru. Данная модель успешно функционирует в сервисе GigaChat, также ею можно воспользоваться, обратившись к мобильным приложениям СберБанк Онлайн и Салют, в том числе, используя голосовую команду «Запусти художника».