Обучение генеративной нейросети под свой стиль/объект на Dafes

Идея

Проект исследует человеческую фигуру через чёрно-белую графику. Базовая идея: Изначальный замысел заключался в создании цифрового продолжения серии черно-белых экспрессивных набросков. Цель обучения ИИ состояла в том, чтобы заставить модель генерировать новые фасоны платьев, строго сохраняя эстетику карандаша, туши и крафтовой небрежности линий, представленную в обучающем наборе. Датасет состоит из авторских рисунков тушью: фигуры людей в простых позах. Характеристики: монохром, искажённые пропорции, акцент на силуэте. (Исходное изображение)

Исходные изображения

В качестве исходного датасета использовались авторские изображения, выполненные в технике чёрной туши. На них представлены фигуры людей в повседневных состояниях: человек с собакой, фигура с тростью, сидящая фигура в закрытой позе.

Исходные изображения

Результирующая серия изображений

В результате обучения была получена серия изображений, демонстрирующая неожиданную, но продуктивную визуальную трансформацию исходного материала. Сгенерированные работы представляют собой высокодетализированные, завершенные цифровые концепты платьев. Нейросеть сохранила заложенные в черно-белых эскизах пластику, сложные позы и структурную динамику, но перевела их из плоскости абстрактного наброска в объемную форму с проработанной фактурой ткани (Результирующая серия)

Результирующая серия изображений

Композиции варьируются от строгих силуэтных решений до сложных, многослойных драпировок, формируя эстетически целостный модельный ряд.

Результирующая серия изображений

При детальном рассмотрении двух представленных примеров — пышного платья и структурированного серого платья — приходится констатировать, что они являются технологически успешными, но художественно ошибочными в контексте данного проекта.

Эти генерации наглядно демонстрируют доминирование базовой модели Stable Diffusion над обученной LoRA. Вместо достижения целевого визуального языка (грубого, экспрессивного, черно-белого карандашного штриха), они уходят в плоскость стандартизированной цифровой иллюстрации в стиле аниме/манги.

Развёрнутый комментарий и анализ

Первоначальная идея проекта заключалась в генерации моделей одежды со строгим сохранением ручной черно-белой карандашной стилистики. Однако итоговая серия раскрывает иной потенциал взаимодействия с нейросетью в контексте дизайна одежды. Удалось передать ключевые структурные элементы: геометрию позы, характер силуэта и напряжение, заложенное в исходной графике. Этот результат концептуально переосмысляет первоначальную идею. Нейросеть выступила не в роли копииста, а как инструмент мгновенного прототипирования. Полученные изображения служат не просто иллюстрациями, а готовыми высококачественными референсами, которые можно напрямую использовать для конструирования реальных изделий и поиска новых форм.

Визуальный анализ серии демонстрирует широкий диапазон результатов, зависящий от того, насколько сильно базовая модель ИИ подавляла паттерны обучающего датасета. С одной стороны, были получены строгие монохромные решения, где алгоритм удачно перевел хаос штрихов в сложную авангардную геометрию и плотную фактуру, сохраняя общую сдержанность. С другой стороны, проявились генерации, значительно отступившие от первоначальной задумки — например, пышное платье на фото. В нем нейросеть полностью проигнорировала монохромную эстетику, добавив полноцветную палитру, гипертрофированно гладкие градиенты и избыточную детализацию (кружева, идеализированные складки).

Ноутбук с кодом и описание процесса обучения

Обучение модели проводилось в среде Google Colab. В качестве базовой архитектуры использовалась Stable Diffusion. Процесс включал следующие этапы: 1.Установка необходимых библиотек 2.Подключение Google Drive и загрузка датасета 3.Загрузка предобученной модели 4.Подготовка изображений (ресайз и нормализация) 5.Настройка параметров обучения (LoRA) 6.Запуск обучения в несколько эпох 7.Генерация итоговых изображений с помощью текстовых промптов Обучение происходило на GPU, что позволило ускорить процесс. Количество эпох было ограничено для предотвращения переобучения.

ноутбук

Код был проверен Gemini