Original size 1140x1600

Современные портреты в стиле Густава Климта: обучение генеративной модели

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция проекта

Проект посвящён исследованию того, как генеративная нейросеть Stable Diffusion может перенести уникальный орнаментальный стиль Густава Климта (золотой период) в жанр современного портрета.

Климт — один из самых ярких представителей венского модерна, чьи работы отличаются золотыми фонами, изогнутыми линиями, орнаментальными узорами и сложной символикой.

Цель проекта — обучить модель Stable Diffusion XL понимать и воспроизводить эти характерные черты, создавая новые портреты, в которых стиль художника органично сочетается с современными образами, чертами лица, одеждой и окружением.

«Поцелуй», 1907–1908 гг. / «Юдифь и Олоферн», 1901 г. Густав Климт

Original size 3497x1209

«Ожидание», 1905–1909 гг. / «Портрет женщины», 1916–1917 гг. / «Портрет Адели Блох-Бауэр I», 1909 г. Густав Климт

Для обучения нейросети был собран датасет из 30 репродукций картин Густава Климта, относящихся к его золотому периоду. Все изображения были приведены к квадратному формату 512×512 пикселей и обработаны вручную для сохранения ключевых элементов стиля: золотые фоны, орнаментальные узоры, плавные линии, портретные композиции.

Original size 1648x532

Подготовка изображений

Процесс обучения

Обучение проводилось в Google Colab с использованием ноутбука SDXL DreamBooth LoRA. Была выбрана базовая модель Stable Diffusion XL с улучшенным VAE (madebyollin/sdxl-vae-fp16-fix).

Original size 1390x658

Часть кода

Датасет был загружен локально в папку klimt. Для каждого изображения в файле metadata.jsonl указан единый промпт, который модель ассоциирует со стилем: «photo collage in KLIMT style»

Original size 2592x876

Загрузка датасета

Original size 1346x866

Код обучения

После первоначальной попытки обучения с автоматически сгенерированными описаниями (BLIP) качество стиля оказалось низким. Было выполнено дообучение с исправленным metadata.jsonl, что позволило модели правильно усвоить ключевые признаки. Общее время обучения на GPU T4 составило около 1 часа.

Итоговые изображения

После обучения модель была применена для генерации портретов. Промпты строились по шаблону: «photo collage in KLIMT style, [описание]».

Для достижения разнообразия использовались различные seed, guidance scale (от 7 до 8.5) и количество шагов (30–40).

Original size 1024x1024

Портрет крупным планом в стиле работ Густава Климта

Original size 1024x1024

Женский портрет в стиле работ Густава Климта

Женские портреты в стиле работ Густава Климта

Original size 1024x1024

Женский портрет в стиле работ Густава Климта

Примеры промптов:

— «photo collage in KLIMT style, close-up of a woman’s face with gold leaf details, abstract floral patterns, high detail, sharp» — «photo collage in KLIMT style, profile portrait of a man with a beard, blue and silver tones, geometric ornaments, moody lighting» — «photo collage in KLIMT style, a couple embracing, golden swirls, red and gold palette, romantic atmosphere, soft focus» — «photo collage in KLIMT style, full body portrait of a dancer in motion, flowing gold ribbons, dynamic composition, bright colors»

Женские портреты в стиле работ Густава Климта

Original size 1024x1024

Портрет женщины в стиле работ Густава Климта

Портрет мужчины в стиле работ Густава Климта

Original size 1024x1024

Портрет кошек Портрет в стиле работ Густава Климта

В итоговой серии изображений удалось передать несколько ключевых элементов, характерных для творчества Климта:

— Золотые фоны и орнаменты — в большинстве генераций присутствуют золотистые пятна, декоративные узоры, напоминающие климтовские круги, спирали и мозаичную текстуру.

— Плавные линии и ар-нуво — контуры лиц, одежды и декоративных элементов часто имеют изогнутую, «растительную» пластику.

— Портретная композиция — модель сохранила центрированный формат, характерный для многих работ Климта, а также крупный план лица, что соответствует оригинальному стилю.

— Цветовая гамма — в сгенерированных изображениях доминируют золотые, тёплые тона, иногда с добавлением синих, зелёных или красных акцентов, что перекликается с палитрой золотого периода.

Вывод

Обучение генеративной модели на репродукциях картин Густава Климта показало, что нейросеть способна перенимать ключевые особенности его стиля (золотые фоны, орнаменты, плавные линии) и переносить их на новые портретные сюжеты. При этом качество результата напрямую зависит от разнообразия датасета и точности промптов.

Для дальнейшего улучшения можно расширить датасет изображениями с различными ракурсами, добавить примеры современных портретов и использовать дополнительные методы управления генерацией (ControlNet).

Таким образом, первоначальная идея проекта — продемонстрировать возможность переноса уникального орнаментального стиля Климта в современные портретные образы — может считаться реализованной. Полученная серия изображений подтверждает гибкость генеративных моделей и их потенциал для стилизации и творческого переосмысления классического искусства.

Генеративные нейросети

Stable Diffusion XL — базовая модель для генерации изображений и дообучения (DreamBooth + LoRA).

ChatGPT (OpenAI) — использовался для формулировки промптов, уточнения описаний и устранения ошибок в коде.

DeepSeek — применялся для объяснения технических деталей, корректировки параметров обучения и анализа результатов.

Современные портреты в стиле Густава Климта: обучение генеративной модели
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more