Original size 1140x1600

Обучение генеративной нейросети под свой стиль

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

post

Цель проекта — проверить, способна ли нейросеть создавать не отдельные изолированные объекты, а текстуры, паттерны, выполненные в стиле ручной ритмичной графики.

Нейросеть обучается на моих иллюстрациях, сделанных тушью и пером, которые передают фактуру и текстуру грибов.

В результирующей серии генерируются цветы, чтобы продемонстрировать способность не просто копировать конкретные объекты из обучающей базы данных, а воспроизводить графический язык.

post

Особенности стиля:

• Черно-белая палитра • Линейная графика • Штриховка • Плотность заполнения листа • Природные мотивы

Результирующая серия изображений

Original size 1600x1152
Original size 1600x1152

Развёрнутый комментарий

Модель успешно передала ключевые приёмы: линии ритмичны и вариативны, штриховка следует за формой объектов, создавая объём, тональность сохраняется через плотность штриха без использования полутонов.

При этом алгоритм не копирует объекты из обучающей выборки — вместо грибов он сгенерировал принципиально новые объекты — цветы, применив нужный графический язык к другому предметному ряду.

Все работы серии сохраняют стилистическую целостность и узнаваемость техники. Нейросеть показала способность работать с текстурной сложностью, создавая композиции с разными типами фактур.

В целом проект демонстрирует, что нейросеть может быть инструментом не просто для генерации изображений, а для сохранения и трансляции авторских художественных техник.

Original size 1600x1152

Были использованы дополнительные методы улучшения изображений:

• Двухэтапное увеличение разрешения (Сначала генерация в меньшем размере, затем апскейлинг до финального размера. Алгоритм LANCZOS — качественная ресемплинг-фильтрация)

• Unsharp Mask: «ImageFilter.UnsharpMask (radius=0.8, percent=100, threshold=0)»

• Negative prompt: «color, photo, realistic, 3d render, blurry, low quality, smooth, gradient, abstract, cartoon»

• Параметры генерации: 35 inference steps — баланс между качеством и скоростью Guidance scale 7.5 — сильное следование промпту (выше стандартного 7.0) Sequential CPU offload — экономия VRAM за счет поочередной загрузки компонентов модели

Процесс обучения

Для обучения нейросети использовались 10 иллюстраций размером 1024×1024px. Обучение нейросети заняло примерно 60 мин.

Параметры обучения:

Базовая модель: Stable Diffusion XL 1.0 LoRA (Low-Rank Adaptation) — легковесная надстройка, обучающая только 23.4MB параметров (вместо полных 6.6GB) 500 шагов обучения с сохранением чекпоинта на 250 шаге Разрешение: 512×512 пикселей Batch size: 2 изображения за шаг Gradient accumulation: 3 шага (эффективный batch size = 6) 8-bit Adam optimizer — экономия памяти Mixed precision fp16 — ускорение вычислений

0

Изначально понимание стиля нейросетью было протестировано на грибах:

Ссылка на код

Использование ИИ:

Stable Diffusion XL — генерация изображений и обучение генеративной модели

DeepSeek — для написании более качественного промта, ускорения его написания и устранения ошибок в коде

Обучение генеративной нейросети под свой стиль
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more