Уральский авангард в нейросети: обучение Stable Diffusion на стиле Петра Субботина-Пермяка


«Ау-у» — 1918 г. | «Отдых над рекой. Чаепитие» — 1916 г.
Концепция
Проект исследует возможности генеративного искусственного интеллекта в контексте сохранения и переосмысления уральского культурного наследия. Центральная идея — обучить нейросеть Stable Diffusion XL воспроизводить уникальную художественную манеру Петра Дмитриевича Субботина-Пермяка (1886–1923), уральского художника-авангардиста, который первым синтезировал европейский авангард с народным искусством Прикамья.
Субботин-Пермяк — фигура особенная в истории уральского искусства. Он считал, что авангард в провинции должен вырастать не из подражания западным образцам, а из живой народной традиции — орнаментов, вышивки, росписи по дереву.
Его работы сочетают геометрическую строгость конструктивизма с декоративностью народного лубка, яркость примитивизма с философской глубиной. Именно эта уникальность делает его стиль интересным объектом для машинного обучения: нейросеть должна уловить не просто визуальные паттерны, но внутреннее противоречие между авангардной формой и народным содержанием.
Проект органично продолжает тему, которую я исследую в рамках работы с архивом народной культуры Урала «ФолкЪ-ТолкЪ» — платформой, собирающей экспедиционные записи, методические фильмы и исследования по уральскому фольклору. Если архив сохраняет живую традицию в её документальном измерении, то данный проект задаётся вопросом: способна ли нейросеть стать инструментом художественного диалога с этой традицией?
Датасет
Для обучения модели использованы изображения работ Петра Субботина-Пермяка из открытых источников — музейных коллекций и архивов, материалы которых находятся в общественном достоянии (Public Domain).
Датасет включает 20 изображений — живопись, графика и декоративные работы художника. Все изображения приведены к квадратному формату 1:1 с разрешением 512×512 пикселей. При кадрировании сохранялась смысловая композиция каждой работы — центральные фигуры и ключевые орнаментальные элементы.
В датасете представлены работы разных периодов и жанров: портреты крестьян и народных типажей, орнаментальные панно, иллюстрации к народным сюжетам, декоративные композиции с геометрическими мотивами. Такое разнообразие позволило нейросети усвоить не один конкретный сюжет, а целостную художественную систему автора.
Процесс обучения
Обучение проводилось в среде Google Colab с использованием GPU Tesla T4 (15 GB VRAM). В качестве базовой модели использовалась Stable Diffusion XL 1.0 (stabilityai/stable-diffusion-xl-base-1.0) с улучшенным вариационным автоэнкодером sdxl-vae-fp16-fix.
Метод дообучения — Dreambooth LoRA (Low-Rank Adaptation).
Параметры обучения:
Количество шагов: 500 Скорость обучения: 1e-4 Размер батча: 2 Gradient accumulation steps: 3 Смешанная точность: fp16 SNR gamma: 5.0 Время обучения: около 40 минут
Результирующая серия изображений
Для генерации финальной серии использовалась следующая схема: базовый триггер стиля + описание конкретного сюжета, вдохновлённого материалами архива «ФолкЪ-ТолкЪ».
Параметры генерации: 50 шагов диффузии, guidance scale 8.5, lora_scale 0.5.








Нейросеть усвоила ключевые характеристики стиля Субботина-Пермяка. В большинстве изображений отчётливо прослеживается плоскостность — пространство не строится по законам перспективы, а разворачивается как орнаментальный ковёр. Цветовые плоскости ограничены жёсткими контурами, что характерно для народного лубка и декоративной живописи.
Орнаментальность — ещё одна удачно переданная черта: фоновые элементы организованы в ритмические паттерны, напоминающие традиционную вышивку и резьбу по дереву. Геометрические формы сосуществуют с органическими — деревья, фигуры людей, природные мотивы — в характерном для художника балансе.
Между изображениями есть заметные вариации. Сцены с огнём и красными тонами (обрядовый танец, кузнец) получились наиболее энергичными и экспрессивными — здесь модель, вероятно, активнее задействовала паттерны из работ с насыщенным цветом. Зимняя и свадебная сцены более сдержанны по колориту, ближе к декоративно-прикладному характеру.
Среди ограничений стоит отметить, что человеческие лица в ряде работ остаются условными.
Описание применения генеративной модели
Merlin AI (Claude Sonnet 4.6, Anthropic) использовался на следующих этапах: выбор художника, отладка кода для обучения модели и генерации изображений, формулировка промптов, написание структурной части лонгрида с последующей авторской редактурой. Ссылка
Основная генеративная модель проекта — Stable Diffusion XL 1.0 (RunwayML / Stability AI), дообученная методом Dreambooth LoRA на авторском датасете из работ П. Субботина-Пермяка. Ссылка
Обученная LoRA-модель доступна на HuggingFace Hub
BLIP (Salesforce) использовался для автоматической генерации подписей к изображениям датасета. Ссылка




