Original size 1240x1750

Обучение генеративной нейросети под авторский стиль

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

Исходные изображения для обучения

Я решила обучить нейросеть на собственный художественный стиль, чтобы увидеть, какие черты окажутся наиболее выразительными и сохранятся в итоговых генерациях.

В датасет попало 17 рисунков, в основном портретов.

Исходные изображения для обучения

Результирующая серия изображений

a woman with long blonde hair and a sword/ anime drawing, a woman with long blonde hair and a sword

Original size 1024x1024

eichi_v style, one cute white rabbit, sitting on a crescent moon

Для начала я сгенерировала несколько изображений с LoRA на максимальной интенсивности. Хотя черты стиля были узнаваемы, на генерациях присутствовало много артефактов и непонятных деталей.

lora_scale=0.5/lora_scale=0.75. «eichi_v style, one cute white rabbit, sitting on a crescent moon»

изображение из исходного датасета/"eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.75

Чтобы добиться лучших результатов, я протестировала разные значения lora_scale и изменения в промптах, добавив «simple anime drawing», так как стандартный SDXL склоняется к фотореализму. Лучше всего показали себя дополненные промпты и lora_scale 0,85. В этих генерациях стиль узнается, при этом артефактов значительно меньше, а лица проработаны точнее.

Original size 1024x1024

«eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.85

Original size 1024x1024

«eichi_v style, simple anime drawing, a woman with long blonde hair and a sword», lora_scale = 0.85

Небольшие артефакты всё же остались, но, думаю, это можно было бы исправить более длительным обучением и дополнительным файнтюнингом под простые аниме-иллюстрации.

simple anime drawing, a gir with pink hair, wearing sunglasses and smoking a cigarette/simple anime drawing, a man with pink hair, wearing sunglasses and smoking a cigarette

Процесс обучения

Перед началом обучения я обрезала все изображения под формат 1024×1024 с помощью сайта birme.net.

Original size 1806x560

Превью датасета

Original size 1829x451

Генерация подписей

После загрузки датасета в Colab были сгенерированы подписи. Обучение на 500 эпох заняло 40 минут.

Original size 1839x456

Обучение

Original size 1830x643

Генерация изображения

Обучение генеративной нейросети под авторский стиль
Project created at 24.03.2026
Loading...
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more