Original size 1813x2560

Обучение генеративной модели Stable Diffusion под стиль Valter

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

Мне захотелось обучить генеративную нейросеть Stable Diffusion своему художественному стилю для генерации новых дизайнов персонажей с различными костюмами. Для этого я собрала датасет со своими редизайнами персонажей Monster High

Основная цель моего проекта — узнать, сможет ли нейросеть повторить мой стиль, а возможно и улучшить мои идеи

Monster High — Американская серия фешн-кукол созданная Гарретом Сэндером и проиллюстрированная Келли Райли. Официальный релиз состоялся в июле 2010 года. Также позже были выпущены видеоигра Monster High: Ghoul Spirit, мультсериал и серия фильмов

Original size 1280x504

Исходные изображения персонажей

0

Примеры из библиотеки

Обучение

Мною был собран датасет из квадратных изображений, которые являются моими собственными артами редизайнами персонажей из вселенной Monster High. Все они выполнены в одном стиле. Цель проекта заключалась именно в том, чтобы нейросеть смогла попасть в мой стиль, соблюсти цветовую гамму и правильно изображала телосложение персонажей

Использованные в проекте программы:

Stable Diffusion — для обучения генеративной нейросети под свой стиль Google Colab — для выполнения кода и генераций Hugging Face — для получения токена для обучения нейросети и загрузки полученной модели на сайт Adobe Photoshop — для создания коллажей из готовых работ

Original size 3008x802

Для начала нужно было загрузить все необходимые библиотеки, а потом загрузить изображения с компьютера в Google Colab, через специальную встроенную функцию в Google Colab

фрагменты кода

Original size 1670x641

Далее был создан токен через Hugging Face, происходила настройка и вставка его в код

Original size 1468x646

Приближаясь к тренировке я выбрала разрешение 512, выставила максимальный шаг тренинга на 800, а чекпоинт установила на 250, так тренировка нейросети заняла всего час

Original size 1649x707

После сохранения модели на Hugging Face я приступила к генерации картинок

Original size 1640x700

Первая генерация

Первая пробная генерация получилась неудачной, но все же прослеживаются схожие с оригиналом черты лица

0

1. In the style of VALTERMARG, portrait of a girl 2. In the style of VALTERMARG, a pale gothic girl 3. In the style of VALTERMARG, a stylized female character

Портреты получались заметно лучше, чем персонажи в полный рост

Original size 1024x1024

In the style of VALTERMARG, pale gothic girl, portrait, dark aesthetic, detailed face, fashion illustration, high quality

Однако нейросеть хорошо считала пропорции и нужные силуэты тел, а также разнообразные текстуры и формы костюмов

Original size 1024x1024

In the style of VALTERMARG, a fashion girl

Original size 1024x1024

In the style of VALTERMARG, dark fantasy werewolf girl, lilac hair, yellow eyes, fangs, punk fashion outfit, confident pose, fashion illustration, clean line art, high detai

Я также поэкспериментировала с промптами

Без упоминания в промпте моего стиля получался более хаотичный по настроению персонаж, после упоминания стиля картинка стала более стилизованой

1. без упоминания моего стиля 2. после упоминания стиля

Подробный промпт: In the style of VALTERMARG, 2d-style character illustration, dark fantasy aesthetic. A skinny werewolf girl with gray skin, sharp gray cat ears pierced with silver rings, and long wavy lilac-purple hair matching her eyebrows and lashes. Her eyes are striking yellow with yellow sclera; she has lilac lips with prominent white fangs. Outfit: olive green fur jacket over a black ripped tank top, dark green mini skirt with belt straps, and chunky platform boots adorned with multiple buckles and straps. Dynamic pose, standing confidently with a slight smirk. Lighting: dramatic low-angle rim light, moody atmosphere. Background: striped light gray with subtle gradient, creating a punk-fashion editorial vibe. Clean line art, vibrant pastel accents, high detail, character sheet style

Итоговые генерации

Так как в начале получались непонятные и скорее абстрактные изображения, была выставлена команда, чтобы стиль влиял на 85%. Благодаря этому получилось добиться более четких деталей в прорисовке, но, несмотря на это, стиль все еще оставался читаемым

Также в негативных промптах были прописаны блюр, искажения, кривые линии, неправильная анатомия, дублируемые персонажи. Это помогло значительно улучшить результаты генераций

1. In the style of VALTERMARG, cyberpunk girl 2. In the style of VALTERMARG, cyberpunk girl

In the style of VALTERMARG, fantasy warrior

Original size 1024x1024

In the style of VALTERMARG futuristic fashion model

1. In the style of VALTERMARG, witch with familiar 2. In the style of VALTERMARG, fairy with butterfly wings

Заметно, что нейросеть выучила, что нужно рисовать персонажам гипертрофированную худобу, характерный высокий рост, небрежность стиля, также удалось добиться достаточно четкой обводки

При сравнении цветовой палитры с оригиналом видно, что нейросеть её учитывает и выдерживает генерируемые изображения в пастельных, пыльных тонах

Подводя итог хочется сказать, что искусственный интеллект не может заменить художника, но может быть хорошим инструментом в умелых руках и помогать ускорить и оптимизировать рабочий процесс для реализации творческих идей

Обучение генеративной модели Stable Diffusion под стиль Valter
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more