Новые нейросети Kandinsky 3.0 и Kandinsky Video от Сбер
На конференции по искусственному интеллекту и машинному обучению AI Journey была представлена новая версия нейросети Kandinsky, которая лучше предыдущих понимает пользователя. Она способна создавать ещё более фотореалистичные изображения и генерировать художественные картины. Также нейросеть Kandinsky 3.0 знакома с элементами культурного кода России - она знает в лицо российских и советских известных личностей и персонажей, а также легко изображает элементы народного искусства России.
Статьи к прочтению:
- Лучшие нейросети для создания и редактирования картинок и изображений
- Лучшие нейросети для улучшения и редактирования фотографий
- Лучшие нейросети для создания и редактирования музыки
Что нового в нейросети Kandinsky?
Пример изображения созданного с помощью нейросети Кандинский 3.0 от Сбера:
Промпт: Милый котенок, в новогодней шапке, пушистый, сказочно. Cтиль: Цифровая живопись.
Разработчики использовали обновлённый датасет в размере 1,5 млрд пар «текст — изображение» для обучения нейросети. Эти данные прошли значительные процедуры фильтрации, что привело к заметному повышению качества генераций.
Kandinsky 3.0 распознает культурный код России и создает художественные картины в разных стилях.
Kandinsky 3.0 разработана и обучена разработчиками Sber AI при поддержке Унверситета искусственного интеллекта AIRI, используя объединенный датасет Sber AI и компании SberDevices. Эта модель понимает запросы на более чем 100 языках, а пользователи могут создавать изображения в любом стиле в неограниченном количестве.
Где протестировать Kandinsky 3.0 от Сбера?
Дополнительную информацию о обновлении Kandinsky 3.0 можно найти в блоге Сбера на Хабре , а протестировать новую нейросеть его можно:
- В Telegram-боте,
- На веб-сайте fusionbrain.ai
- Сайте rudalle.ru
- Чат во ВКонтакте
- Сервис от Сбера GigaChat
- На всех умных устройствах Sber по голосовой команде "Запусти художника"
Что такое Kandinsky Video?
Еще одна крутая фишка - это Kandinsky Video, первая в России нейронная сеть, способная генерировать видео с плавным видеорядом и скоростью 30 кадров в секунду. Кроме того, пользователи могут создавать видеоролики продолжительностью до 8 секунд. Модель Kandinsky Video обучалась с использованием датасета из 300 000 пар "текст - видео" и состоит из двух ключевых блоков, работающих вместе. Один блок отвечает за структуру сюжета, а другой блок - за плавность движений. Для генерации кадров в Kandinsky Video используется обновленная модель Kandinsky 3.0.
Подробнее про нейросеть Kandinsky Video можно прочесть в блоге Сбера на Хабре, а протестировать — на платформе fusionbrain.ai или Telegram-боте.
Пример видео созданного с помощью нейросети Кандински Video от Сбера:
Промпт: Реалистичное изображение красиво украшенной рождественской елки с разнообразными мягкими и красочными украшениями и мягко мерцающими огоньками. Елка возвышается в уютной и темной гостиной, окруженная грудой красиво завернутых подарков. Четкий фокус. Мягкие блики, интерьерная фотография.