Идея проекта: обучение модели для генерации изображений в стиле иллюстраторского проекта Не плачь, пей кофе.




Для обучения модели Stable Diffusion использовался исходный код из лекции и датасет из 12 квадратных изображений, доступный по ссылке ниже.

Итоговая серия


В сгенерированной серии представлены различные сюжетные иллюстрации с птицами в роли главных героев. Обученная модель смогла идеально передать цветовую палитру и текстуру мазков оригинала. Из отдельных элементов хорошо передаются головы и глаза птиц, а также паттерн крыла.



В ходе работы над проектом я также прибегала к использованию ChatGPT для исправления ошибок, возникающих в коде.


Несмотря на присутствие артефактов, в целом обучение модели прошло успешно с учетом небольшого размера исходного датасета. Нейросеть смогла выделить характерные особенности стиля и даже такие детали, как шапочка у голубя, что позволило максимально приблизить генеративные изображения к оригиналу по настроению и палитре.




