Уральский авангард в нейросети: обучение Stable Diffusion на стиле Петра Субботина-Пермяка

«Ау-у» — 1918 г. | «Отдых над рекой. Чаепитие» — 1916 г.

Концепция

Проект исследует возможности генеративного искусственного интеллекта в контексте сохранения и переосмысления уральского культурного наследия. Центральная идея — обучить нейросеть Stable Diffusion XL воспроизводить уникальную художественную манеру Петра Дмитриевича Субботина-Пермяка (1886–1923), уральского художника-авангардиста, который первым синтезировал европейский авангард с народным искусством Прикамья.

Субботин-Пермяк — фигура особенная в истории уральского искусства. Он считал, что авангард в провинции должен вырастать не из подражания западным образцам, а из живой народной традиции — орнаментов, вышивки, росписи по дереву.

Его работы сочетают геометрическую строгость конструктивизма с декоративностью народного лубка, яркость примитивизма с философской глубиной. Именно эта уникальность делает его стиль интересным объектом для машинного обучения: нейросеть должна уловить не просто визуальные паттерны, но внутреннее противоречие между авангардной формой и народным содержанием.

Проект органично продолжает тему, которую я исследую в рамках работы с архивом народной культуры Урала «ФолкЪ-ТолкЪ» — платформой, собирающей экспедиционные записи, методические фильмы и исследования по уральскому фольклору. Если архив сохраняет живую традицию в её документальном измерении, то данный проект задаётся вопросом: способна ли нейросеть стать инструментом художественного диалога с этой традицией?

Датасет

Исходный размер 1585x1001

Для обучения модели использованы изображения работ Петра Субботина-Пермяка из открытых источников — музейных коллекций и архивов, материалы которых находятся в общественном достоянии (Public Domain).

Датасет включает 20 изображений — живопись, графика и декоративные работы художника. Все изображения приведены к квадратному формату 1:1 с разрешением 512×512 пикселей. При кадрировании сохранялась смысловая композиция каждой работы — центральные фигуры и ключевые орнаментальные элементы.

В датасете представлены работы разных периодов и жанров: портреты крестьян и народных типажей, орнаментальные панно, иллюстрации к народным сюжетам, декоративные композиции с геометрическими мотивами. Такое разнообразие позволило нейросети усвоить не один конкретный сюжет, а целостную художественную систему автора.

Ссылка на диск

Процесс обучения

Обучение проводилось в среде Google Colab с использованием GPU Tesla T4 (15 GB VRAM). В качестве базовой модели использовалась Stable Diffusion XL 1.0 (stabilityai/stable-diffusion-xl-base-1.0) с улучшенным вариационным автоэнкодером sdxl-vae-fp16-fix.

Метод дообучения — Dreambooth LoRA (Low-Rank Adaptation).

Параметры обучения:

Количество шагов: 500 Скорость обучения: 1e-4 Размер батча: 2 Gradient accumulation steps: 3 Смешанная точность: fp16 SNR gamma: 5.0 Время обучения: около 40 минут

Результирующая серия изображений

Для генерации финальной серии использовалась следующая схема: базовый триггер стиля + описание конкретного сюжета, вдохновлённого материалами архива «ФолкЪ-ТолкЪ».

Параметры генерации: 50 шагов диффузии, guidance scale 8.5, lora_scale 0.5.

Исходный размер 1024x1024

Нейросеть усвоила ключевые характеристики стиля Субботина-Пермяка. В большинстве изображений отчётливо прослеживается плоскостность — пространство не строится по законам перспективы, а разворачивается как орнаментальный ковёр. Цветовые плоскости ограничены жёсткими контурами, что характерно для народного лубка и декоративной живописи.

Орнаментальность — ещё одна удачно переданная черта: фоновые элементы организованы в ритмические паттерны, напоминающие традиционную вышивку и резьбу по дереву. Геометрические формы сосуществуют с органическими — деревья, фигуры людей, природные мотивы — в характерном для художника балансе.

Между изображениями есть заметные вариации. Сцены с огнём и красными тонами (обрядовый танец, кузнец) получились наиболее энергичными и экспрессивными — здесь модель, вероятно, активнее задействовала паттерны из работ с насыщенным цветом. Зимняя и свадебная сцены более сдержанны по колориту, ближе к декоративно-прикладному характеру.

Среди ограничений стоит отметить, что человеческие лица в ряде работ остаются условными.

Описание применения генеративной модели

Merlin AI (Claude Sonnet 4.6, Anthropic) использовался на следующих этапах: выбор художника, отладка кода для обучения модели и генерации изображений, формулировка промптов, написание структурной части лонгрида с последующей авторской редактурой. Ссылка

Основная генеративная модель проекта — Stable Diffusion XL 1.0 (RunwayML / Stability AI), дообученная методом Dreambooth LoRA на авторском датасете из работ П. Субботина-Пермяка. Ссылка

Обученная LoRA-модель доступна на HuggingFace Hub

BLIP (Salesforce) использовался для автоматической генерации подписей к изображениям датасета. Ссылка

Источники и библиография

Работы художника. Ссылка
Архив «Фолък — Толък». Ссылка

«Пермский код». Уральский авангард глазами нейросети

Концепция

Источники и библиография