Original size 657x876

«Пермский код». Уральский авангард глазами нейросети

PROTECT STATUS: not protected
The project is taking part in the competition

Уральский авангард в нейросети: обучение Stable Diffusion на стиле Петра Субботина-Пермяка

«Ау-у» — 1918 г. | «Отдых над рекой. Чаепитие» — 1916 г.

Концепция

Проект исследует возможности генеративного искусственного интеллекта в контексте сохранения и переосмысления уральского культурного наследия. Центральная идея — обучить нейросеть Stable Diffusion XL воспроизводить уникальную художественную манеру Петра Дмитриевича Субботина-Пермяка (1886–1923), уральского художника-авангардиста, который первым синтезировал европейский авангард с народным искусством Прикамья.

Субботин-Пермяк — фигура особенная в истории уральского искусства. Он считал, что авангард в провинции должен вырастать не из подражания западным образцам, а из живой народной традиции — орнаментов, вышивки, росписи по дереву.

Его работы сочетают геометрическую строгость конструктивизма с декоративностью народного лубка, яркость примитивизма с философской глубиной. Именно эта уникальность делает его стиль интересным объектом для машинного обучения: нейросеть должна уловить не просто визуальные паттерны, но внутреннее противоречие между авангардной формой и народным содержанием.

Проект органично продолжает тему, которую я исследую в рамках работы с архивом народной культуры Урала «ФолкЪ-ТолкЪ» — платформой, собирающей экспедиционные записи, методические фильмы и исследования по уральскому фольклору. Если архив сохраняет живую традицию в её документальном измерении, то данный проект задаётся вопросом: способна ли нейросеть стать инструментом художественного диалога с этой традицией?

Датасет

Original size 1585x1001

Для обучения модели использованы изображения работ Петра Субботина-Пермяка из открытых источников — музейных коллекций и архивов, материалы которых находятся в общественном достоянии (Public Domain).

Датасет включает 20 изображений — живопись, графика и декоративные работы художника. Все изображения приведены к квадратному формату 1:1 с разрешением 512×512 пикселей. При кадрировании сохранялась смысловая композиция каждой работы — центральные фигуры и ключевые орнаментальные элементы.

В датасете представлены работы разных периодов и жанров: портреты крестьян и народных типажей, орнаментальные панно, иллюстрации к народным сюжетам, декоративные композиции с геометрическими мотивами. Такое разнообразие позволило нейросети усвоить не один конкретный сюжет, а целостную художественную систему автора.

Процесс обучения

Обучение проводилось в среде Google Colab с использованием GPU Tesla T4 (15 GB VRAM). В качестве базовой модели использовалась Stable Diffusion XL 1.0 (stabilityai/stable-diffusion-xl-base-1.0) с улучшенным вариационным автоэнкодером sdxl-vae-fp16-fix.

Метод дообучения — Dreambooth LoRA (Low-Rank Adaptation).

Параметры обучения:

Количество шагов: 500 Скорость обучения: 1e-4 Размер батча: 2 Gradient accumulation steps: 3 Смешанная точность: fp16 SNR gamma: 5.0 Время обучения: около 40 минут

Результирующая серия изображений

Для генерации финальной серии использовалась следующая схема: базовый триггер стиля + описание конкретного сюжета, вдохновлённого материалами архива «ФолкЪ-ТолкЪ».

Параметры генерации: 50 шагов диффузии, guidance scale 8.5, lora_scale 0.5.

Original size 1024x1024
0
Original size 1024x1024
0

Нейросеть усвоила ключевые характеристики стиля Субботина-Пермяка. В большинстве изображений отчётливо прослеживается плоскостность — пространство не строится по законам перспективы, а разворачивается как орнаментальный ковёр. Цветовые плоскости ограничены жёсткими контурами, что характерно для народного лубка и декоративной живописи.

Орнаментальность — ещё одна удачно переданная черта: фоновые элементы организованы в ритмические паттерны, напоминающие традиционную вышивку и резьбу по дереву. Геометрические формы сосуществуют с органическими — деревья, фигуры людей, природные мотивы — в характерном для художника балансе.

Между изображениями есть заметные вариации. Сцены с огнём и красными тонами (обрядовый танец, кузнец) получились наиболее энергичными и экспрессивными — здесь модель, вероятно, активнее задействовала паттерны из работ с насыщенным цветом. Зимняя и свадебная сцены более сдержанны по колориту, ближе к декоративно-прикладному характеру.

Среди ограничений стоит отметить, что человеческие лица в ряде работ остаются условными.

Описание применения генеративной модели

Merlin AI (Claude Sonnet 4.6, Anthropic) использовался на следующих этапах: выбор художника, отладка кода для обучения модели и генерации изображений, формулировка промптов, написание структурной части лонгрида с последующей авторской редактурой. Ссылка

Основная генеративная модель проекта — Stable Diffusion XL 1.0 (RunwayML / Stability AI), дообученная методом Dreambooth LoRA на авторском датасете из работ П. Субботина-Пермяка. Ссылка

Обученная LoRA-модель доступна на HuggingFace Hub

BLIP (Salesforce) использовался для автоматической генерации подписей к изображениям датасета. Ссылка

Источники и библиография

  1. Работы художника. Ссылка

  2. Архив «Фолък — Толък». Ссылка

«Пермский код». Уральский авангард глазами нейросети
Project created at 21.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more