Original size 546x760

HONG KONG

PROTECT STATUS: not protected
The project is taking part in the competition

ЦЕЛЬ ПРОЕКТА

Создать собственную генеративную модель на базе Stable Diffusion, обученную на авторских фотоработах, и исследовать возможность переноса индивидуального визуального стиля в нейросреду.

Original size 2300x1084

ИСХОДНЫЕ ИЗОБРАЖЕНИЕ

Original size 4944x996

В качестве исходного материала я использовала серию фотографий, снятых в Гонконге для новой коллекции бренда Asia st71. Этот город был выбран не случайно: его визуальная среда — плотная застройка, неоновые вывески, поток людей и культурные маркеры — формирует узнаваемую атмосферу, которая напрямую влияет на характер изображений.

Original size 2300x1132
Original size 4944x996
Original size 4944x996
Original size 2300x1097

РЕЗУЛЬТАТЫ ИЗОБРАЖЕНИЙ

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

0

фото+фрагмент кода к нему

ПРИНЦИП РАБОТЫ КОДА

Original size 1361x1017

Проверяем GPU и Устанавливаем необходимые библиотеки для дальнейшей работы (для описания изображения и обучения модели ии).

0

Выводим наш датасет с фотографиями с помощью заготовленной функции. В общем числе у нас получилось 39 фотографий для создания модели. Это оказалось мало и далее мы увидим почему.

Original size 1172x334

Основное написание по которому будем генерировать фотографии «make photo in Karina style».

Original size 1112x747

Такой вывод получился по сгенерированным подписям.

Original size 1109x706

Далее у нас идет создание параметров для нашей модели. Выбираем разрешение 512, количество шагов обучения ставим 500, чекпоинт 250. Это сократит время обучения нашей модели.

Как итог, мы видим, что фотографии оказались не совсем идеальные: неровные черты частей тела, не всегда удачная генерация лиц, рук и особенно пальцев (это то, что очень долго не получалось делать у ИИ). Но наша модель смогла обучиться тому, что определила позы модели, общие черты лица и тела, фон. Но на некоторых фотографиях был намеренно размытый фон для передачи динамики большого города. Естественно, это повлекло за собой то, что наша модель иногда не могла точно его разобрать. Можно увеличить датасет с фотографиями до 500-1000 штук, увеличить шаги при обучении (от 1500 шагов). Это увеличит время создания модели, но в этом случае она лучше рассмотрит фото для генераций.

HONG KONG
Project created at 23.03.2026
Loading...
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more