Kandinsky понимает запросы из широкого списка более чем на 100 языках, пользователи могут создавать фотореалистичные изображения в неограниченном количестве, применяя самые разные стили, - отмечается в сообщении. Модель также умеет менять отдельные объекты и целые области на картинке, смешивать несколько рисунков, дорисовывать изображение, создавать картины в режиме бесконечного полотна (inpainting/outpainting). Нейросеть хорошо знает отечественный культурный код: архитектурные достопримечательности, объекты и элементы народного искусства.
Кроме того, пользователи Kandinsky могут создавать четырёхсекундные анимационные ролики и полноценные видео длиной до восьми секунд. Таким образом, генеративная модель Сбера помогает реализовать практически любую творческую задумку.
Модель разработали и обучили исследователи Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices, - добавляется в релизе.