Original size 1140x1600

Невеста для Толика

The project is taking part in the competition

Около полугода назад я от скуки смотрела объявления на сервисе Авито. На глаза мне попался Толик — канадский сфинкс, который ищет себе идеальную невесту.

Толик покорил мое сердце, и я решила помочь ему: подобрать для Толика идеальную невесту.

post

Толик — ласковый, спокойный и умный парень. В его взгляде отражается его вдумчивость и мудрость. Нужно подобрать невесту под стать этому невероятному коту.

Важные условия для будущей избранницы: — ухоженность — чистоплотность

В этом проекте я визуализирую для Толика идеальных кандидаток в жены.

Кандидатка № 1

big
Original size 1024x1024
Original size 1024x1024

Кандидатка № 2

Original size 1024x1024
Original size 1024x1024

Кандидантка № 3

Original size 1024x1024
0

Благодаря тому, что нейросеть обучалась на двух датасетах: с изображениями Толика и с фотографиями разных кошек, итоговые генерации получились живыми, будто сделаны на ретро-фотоаппарат.

Таким образом, с помощью обученной ии получился каталог невест для Толика.

Ход работы

post

Я собрала базу данных, в которой разместила около 30 фотографий разных пород кошек. Все фотографии «живые», что поспособствовало стилю генераций.

Original size 4279x1024

Фрагмент датасета Толика

Принцип работы кода

Для дообучения и генерации изображений использована Stable Diffusion.

1. УСТАНОВКА БИБЛИОТЕК

Original size 1157x67

фрагмент кода «установка библиотек»

2. ЗАГРУЗКА ДАТАСЕТОВ

Код анализирует датасет с потенциальными женами и датасет с Фотографиями, следовательно, загружаем отдельно обе базы данных.

После, датасеты разархивируются.

3. ПОДГОТОВКА ДАТАСЕТОВ

Происходит конвертация в PNG, приведение изображений к квадрату и ресайз до 512×512. Также для каждого изображения создаётся .txt файл и разделение ролей: жена = skscatwife, муж = skscathusband sphynx.

Фрагменты кода с загрузкой и подготовкой датасетов

4. ОБУЧЕНИЕ LoRA

Загружается тренировочный скрипт (DreamBooth LoRA), обучение идет отдельно на каждом датасете.

5. ЗАГРУЗКА PIPELINE

Загружается базовая модель: «stabilityai/stable-diffusion-xl-base-1.0», затем подключаются LoRA и активируются адаптеры.

0

обучение на датасетах

Original size 982x747

фрагмент кода с загрузкой пайплайнов и проверкой LoRA

6. ГЕНЕРАЦИЯ

Для генерации двух видов сцен, я использовала 2 промпта: «Кошка в свадебном платье» и «Кошка в быту»

0

фрагмент кода с генерацией. Промты для 1 и 2 видов изображений.

примеры генераций по 1 и 2 промпту

P.S.

Надеюсь, что у Толика получится найти «ту самую»

We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more