Original size 850x1208

Обучение генеративной нейросети на картинах Марии Головкиной

PROTECT STATUS: not protected
The project is taking part in the competition

Описание идеи

Мария Головкина — визуальная художница из Тулы, работающая на пересечении графики, энкаустики и инсталляции. В своих работах она исследует темы идентичности, постсоветского пространства и экологических изменений эпохи антропоцена — то, что остаётся на периферии официального взгляда, но формирует среду и память.

Меня привлекла прежде всего работа Головкиной с цветом и атмосферой: её работы существуют в состоянии между чёткостью и растворением, где форма угадывается, но никогда не договаривается до конца. Особый интерес вызвала техника — художница работает соусом на картоне, что даёт бархатистую, почти осязаемую фактуру поверхности и мягкие переходы тона, недостижимые в обычной графике. Именно эта телесность материала и приглушённая, но насыщенная цветовая среда стали для меня главным вызовом: удастся ли нейросети уловить не просто визуальный образ, но и ощущение от работы.

Этот проект — это попытка научить нейросеть видеть мир так, как видит его Головкина: через характерную пластику линий, фактуру и специфическую цветовую интонацию её работ.

Можно ли передать авторский язык художника с помощью алгоритма, и что при этом теряется, а что неожиданно сохраняется?

Исходные изображения

0

Для обучения модели было собрано около 30 работ из личного портфолио Марии Головкиной — с её разрешения на использование в учебных целях.

Изображения подбирались так, чтобы охватить характерные черты её визуального языка: работу с тоном, фактуру соуса на картоне и атмосферу, типичную для разных серий.

Все изображения были приведены к квадратному формату 1:1 для корректной подачи в модель.

Процесс обучения

Original size 1112x670

Фрагмент кода

За основу был взят скрипт официальной библиотеки Diffusers от HuggingFace.

Базовая модель — Stable Diffusion XL, которая дообучалась методом DreamBooth + LoRA: вместо полного переобучения всех весов модели техника LoRA обновляет лишь небольшое подмножество параметров, что позволяет запустить процесс на одном GPU T4 в Kaggle без потери качества.

Перед обучением каждое изображение из датасета было автоматически подписано с помощью модели BLIP (Salesforce), которая генерирует текстовое описание к каждой работе.

Для экономии памяти GPU использовались: смешанная точность (float16), градиентный чекпоинтинг и оптимизатор 8-bit Adam из библиотеки bitsandbytes.

Обучение проводилось на платформе Kaggle с ускорителем Tesla T4.

Результирующая серия изображений

Original size 2048x2048

prompt = «photo collage in GOLOVKINA style, red square, Moscow, Russia, black and white colors»

Original size 1024x1024

prompt = «photo collage in GOLOVKINA style, portrait a man»

Original size 1024x1024

prompt = «photo collage in GOLOVKINA style, lake»

Нейросети удалось уловить наиболее «поверхностные» характеристики стиля Головкиной: цветовые отношения, общую тональность работ и отчасти характер мазка. В сгенерированных изображениях узнаётся приглушённая, насыщенная цветовая среда, типичная для её серий.

Однако то, что делает работы Головкиной по-настоящему сильными, передать не получилось.

Нейросеть воспроизводит визуальную поверхность, но не смысловой слой: из изображений уходит напряжение, внутренняя тишина и ощущение материала как высказывания.

Это, пожалуй, главный вывод проекта: генеративная модель способна обучиться языку художника, но не его интонации.

Обучение генеративной нейросети на картинах Марии Головкиной
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more