Original size 688x1024

Обучение генеративной нейросети своему стилю

PROTECT STATUS: not protected
The project is taking part in the competition

Описание идеи

Я очень люблю рисовать животных и создавать иллюстрации с ними. Для меня каждая линия, каждый силуэт — это способ передать характер, настроение, историю.

А сможет ли нейросеть воспроизвести мой стиль и показать мне животных, которых я сама ещё не рисовала?

Используя технологию LoRA, я решила обучить модель на своих рисунках, чтобы она научилась понимать мой почерк.

0

Исходные изображения

Процесс обучения

Я собрала 10 своих рисунков животных и загрузила их в Google Colab через интерфейс. Все изображения я привела к квадратному формату.

Чтобы модель понимала, что именно она видит, каждому рисунку нужно текстовое описание. Для этого я использовала модель BLIP, которая автоматически создала подписи. К каждому описанию я добавила уникальный идентификатор стиля — ключевую фразу «Animal style».

Original size 1325x668

Добавление файлов

Original size 1531x398

Уникальный идентификатор «Animal style»

В качестве базы я взяла предобученную модель stabilityai/stable-diffusion-xl-base-1.0. Обучение проводилось с такими настройками:

  1. Разрешение 512×512
  2. Размер батча 2
  3. Скорость обучения 1e-4
  4. 500 шагов обучения,
  5. Градиентное накопление для экономии памяти,
  6. Смешанная точность fp16,
  7. 8-битный оптимизатор Adam

Эти параметры позволили обучить LoRA-веса за 40 минут в бесплатном Colab.

Original size 1394x387

Настройки обучения

Результирующая серия изображений

Original size 1024x1024

Вывод

Нейросеть, обученная на моих рисунках животных, уловила общую манеру: лёгкость контурной линии, внимание к силуэту и способность создавать цельную композицию. Модель смогла воспроизвести некоторых новых животных, сохранив при этом характерную для оригинала фактуру фона и мягкую штриховку.

Наиболее удачные генерации С оленем, медведем и волком модель справилась лучше всего.

Олень получился с изящными линиями рогов и воздушным пространством вокруг.

Медведь — с монументальностью и мягкой проработкой шерсти.

Волк — с напряжённым силуэтом на горе, передающим дикую грацию.

Частичный успех Генерация с лошадью удалась лишь наполовину: фон сохранил нужную фактуру и лёгкость, но само животное выглядит слишком реалистично, что нарушает стилистическое единство.

Неудачные примеры Лиса и киты получились менее выразительными. В этих случаях модель, видимо, «ушла» в более обобщённые или реалистичные образы.

Что получилось лучше всего Наиболее стабильно нейросеть передаёт фактуру фона — воздушную, с мягкими переходами и глубиной, что стало сильной стороной проекта.

Использование ГенИИ

Я использовала DeepSeek для помощи с кодом, текстом и генерации промптов.

Обучение генеративной нейросети своему стилю
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more