Original size 733x1024

Обучение Stable Diffusion / «Котовселенная»

PROTECT STATUS: not protected
The project is taking part in the competition

ИДЕЯ

Создание серии сюрреалистичных и стилизованных изображений моего кота Сайрекса. Идея заключается в том, чтобы поместить его в необычные, фантазийные миры или ситуации, сохраняя при этом его уникальные черты. Цель — научить нейросеть узнавать конкретного питомца: его окрас, форму глаз, положение пятен.

Проект исследует грань между документальной точностью фотографии и безграничной фантазией генеративных моделей.

Все изображения сделаны мной, так как в качестве датасета я использовала личный архив фотографий моего кота. Объём датасета: 30 изображений.

Я отбирала фотографии с разными ракурсами и позами, чтобы модель выучила объёмную форму кота.

Все изображения также были обрезаны до квадрата (1:1) и приведены к разрешению 1024×1024 пикселя. Фотографии используют идентичные имена для использования в обучении.

Примеры изображений из датасета

Примеры изображений из датасета

Примеры изображений из датасета

ОБУЧЕНИЕ

Вся работа строилась на коде преподавателя, поэтому порядок действий был полностью сохранён:

  1. Подготовка и загрузка необходимых библиотек;
  2. Импорт датасета, авторазметка;
  3. Обучение нейросети;
  4. Сохранение обученной модели и создание итоговых изображений.
Original size 1352x854

РЕЗУЛЬТАТ

Для организации серии итоговых изображений я выбрала принцип от простого к сложному. В начале использованы краткие промпты, в ходе создания следующих генераций они усложняются.

prompts: cat syrex on the moon / cat syrex in the pool

Сначала я использовала максимально простые промпты для проверки работы обученной модели, задача была поместить Сайрекса в разное окружение.

Original size 1024x1024

prompt: cat syrex in a library surrounded by books

prompts: cat syrex walking on water / with a butterfly

Модель выдавала неплохие результаты с представлением Сайрекса в роли разных профессий, потому я продолжила идти в этом направлении.

Original size 1024x1024

prompt: cat syrex as a businessman in an office

prompt: cat syrex as a ballerina / a gardener

Original size 1024x1024

prompt: cat syrex as a beekeeper, protective suit, surrounded by bees

prompts: cat syrex as a geisha, traditional kimono, cherry blossoms / as a detective with a trench coat and magnifying glass

prompt: cat syrex as a sushi chef, making rolls, Japanese restaurant / as a firefighter, holding a hose, dramatic fire background

Далее я решила перейти к более фентезийным промптам: сгенерировать средневековые образы.

Original size 1024x1024

prompt: cat syrex on a throne, wearing a tiny crown, royal

prompts: cat syrex as a wizard, triangle hat, magic around / as a pirate on a ship

Original size 1024x1024

prompt: cat syrex as a knight in an armor

prompts: cat syrex as a samurai with armor and katana, Japanese ink painting style / as an Egyptian pharaoh, golden collar, pyramids background, ancient

После я перешла к необычному окружению и поместила Сайрекса в разные фентезийные локации.

Original size 1024x1024

prompt: cat syrex in a cyberpunk city, neon buildings

prompts: cat syrex in a magic forest, big mushrooms, color leaves / in a space surrounded by planets and stars

Original size 1024x1024

prompt: cat syrex inside a snow globe, winter wonderland, miniature

Финальной идеей я выбрала разные художественные стили для изображения Сайрекса.

prompts: cat syrex made of stained glass, colorful, cathedral window style / in the style of Van Gogh, swirling starry night background, oil painting

Original size 1024x1024

prompt: cat syrex as a graffiti, spray can, colorful mural, urban

Подводя результаты скажу, что обученая нейросеть неплохо справилась с изображением конкретного кота, но местами всё же выдавала неточные результаты.

Обучение Stable Diffusion / «Котовселенная»
Project created at 22.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more