Original size 1696x2528
The project is taking part in the competition

концепция проекта

проект посвящён обучению модели Stable Diffusion стилю Караваджо: создание авторской LoRA-адаптации
цель — научить модель воспроизводить:
✦ кьяроскуро (резкий свет/тень) ✦ драматичную композицию ✦ тёмные фоны + направленный свет

датасет

для обучения был собран датасет из 63 изображений, взятых с сайта Wikipedia
ссылка на датасет

big
Original size 1280x913

Saint Jérôme écrivant (1606)

Saint Jérôme en méditation (1605-1606) Saint Jean-Baptiste (1605-1606)

серия сгенерированных изображений

после обучения LoRA было сгенерировано 6 изображений по различным промптам, охватывающим ключевые темы творчества Караваджо
(1) мужчина с лютней
caravaggio_style, a street musician in a tavern, dark background, warm highlights

Original size 5080x3275

Свет акцентирует лицо и руки, детали создают ощущение объёма. На исходной генерации неудачны только лицо и рука.

(2) старик с шляпой
caravaggio_style, a portrait of an old man, solemn expression, theatrical light
(3) мужчина в красной мантии
caravaggio_style, a saint in a red cloak, intense side lighting

Original size 5080x2679

Тёмный фон акцентирует характер и эмоции; красный плащ выделяется, складки реалистичные. На исходных генерациях неудачны только лица и руки.

(4) натюрморт с фруктами
caravaggio_style, still life with fruit and metal bowl, deep shadows

Original size 2752x1536

Тёмный фон и свет создают объём фруктов. Цвет насыщен, как у Караваджо. На исходной генерации неудачная детализация.

(5) группа мужчин за столом
caravaggio_style, a biblical scene with two figures at a table, strong chiaroscuro

Original size 5080x2421

Персонажи в динамическом взаимодействии, выражения и движения создают драму. На исходной генерации проблемы только с лицами и анатомией.

(6) мальчик со свечой
caravaggio_style, a young boy holding a candle in a dark room, oil painting, dramatic light

Original size 5080x3231

Свет с левой стороны создаёт драматический контраст с тёмным фоном. Лицо тревожное, ткань реалистична. На исходной генерации неудачны руки.

описание процесса обучения

среда выполнения: Google Colab (GPU Tesla T4)
(1) проверка оборудования и установка зависимостей
(2) загрузка датасета

(3) предобработка изображений

Original size 4096x3108

(5) обучение LoRA

Original size 3104x2032

(7) генерация изображений

использование GenAI в проекте

(1) DeepSeek
✦ помощь в написании кода ✦ формулировка экспликации
(2) ChatGPT
✦ формирования идей для промптов ✦ уточнение искусствоведческих формулировок
(3) Nano-banana
Применялся на этапе постобработки. Несмотря на качественное усвоение стиля Караваджо, модель SD при генерации допускала анатомические неточности. С помощью Nano-banana были исправлены пропорции рук, детализация лиц и устранены мелкие артефакты, что позволило представить финальную серию в более качественном виде без потери стилистической целостности.

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more