Original size 1140x1600

Рождение фиолетового динозаврика

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

post

Целью данного проекта стало создание и обучение нейросети рисовать авторского персонажа — фиолетового динозаврика с крыльями. Идея родилась из желания соединить традиционное рисование с современными технологиями: я нарисовала 15 изображений своего персонажа в разных позах, а затем обучила Stable Diffusion воспроизводить его в новых, ранее не существовавших ситуациях.

Почему динозаврик? Этот образ обладает рядом узнаваемых характеристик: фиолетовый цвет, наличие двух крыльев, милый мультяшный стиль, круглые глаза, простота форм. Такая комбинация признаков позволяет проверить, насколько хорошо нейросеть способна уловить и воспроизвести сложные сочетания визуальных элементов.

post

Для обучения были подготовлены мои собственные рисунки дино. Изображения имели:

  1. Квадратный формат

  2. Однотонный фон

  3. Единый художественный стиль (цифровой рисунок, чёткие линии)

  4. Разнообразие поз и ракурсов

Список использованных в проекте инструментов:

— Stable Diffusion — обучение генеративной нейросети под свой стиль; — Google Colab — выполнение кода и генераций; — LoRA — метод дообучения; — HuggingFace — обучение нейросети;

Исходные изображения персонажей

нападающий и грустный дино

спящий и боковой ракурс дино

Описание процесса обучения

Сначала потребовалось загрузить все необходимые для работы библиотеки. Я установила diffusers, transformers, accelerate, peft, torch и xformers.

Далее нужно было загрузить изображения с компьютера в Google Colab. Я использовала встроенную функцию files.upload ().

Далее было создание датасета и подготовка данных. Присвоение каждому изображению текстового описания — промпта с триггерным словом zadino.

Original size 1375x708
Original size 1976x410

первые генерации

Следующим шагом была загрузка модели Stable Diffusion. Для дообучения я использовала метод LoRA.

Original size 1280x804
Original size 1012x241
Original size 1975x796

начало получаться лучше

Самый важный этап — обучение модели. Я установила 100 эпох (полных проходов по всем изображениям).

Обученная модель позволяла генерировать новые изображения по текстовым описаниям. Для улучшения качества я использовала детальные промпты, в которых явно указывала цвет (#6C6994), наличие двух крыльев, форму глаз.

Original size 1280x954
Original size 984x1041

Всего было сгенерировано более 60 изображений в различных сценах. Я сохранила их и собрала в один ZIP-архив вместе с исходными рисунками для удобства.

Качество результата

Консистентность стиля: единый мультяшный стиль во всех 60+ изображениях.

Передача особенностей: фиолетовый цвет, крылья, глаза — ключевые признаки переданы успешно.

Вариативность: разнообразие сцен от бытовых до фантастических.

Original size 1975x796

Подводя итог этого проекта, важно осмыслить главное: нейросеть — это мощный, но всё же инструмент в руках художника, а не самостоятельный творец. За время работы над проектом я поняла одну важную вещь: нейросеть — это не конкурент художнику, а его соавтор. Она берёт на себя рутинную, техническую часть — быструю генерацию, перебор вариантов, масштабирование идеи. Но именно художник остаётся тем, кто задаёт направление, определяет качество, несёт ответственность за конечный результат.

Рождение фиолетового динозаврика
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more