Original size 1136x1600

Обучение модели LоRA на основе гравюр Кацусика Хокусая

PROTECT STATUS: not protected
The project is taking part in the competition

Обложка сгенерирована при помощи обученной нейросети

Обучение LoRA-модели для генерации изображений в эстетике японской гравюры Кацусики Хокусая

Для обучения была взята серия работ Кацусики Хокусая (самый распространенный псевдоним одного из наиболее известных японских художников направления укиё-э)

В работе используется метод LoRA-дообучения на базе модели Stable Diffusion XL. Исходный набор изображений состоит из 35 работ.

0

Работы Кацусика Хокусай

Для его работ характерны декоративность, плоскостное цветовое решение, природные мотивы и особая организация пространства.

Работы Кацусика Хокусай

Описание обучения модели

Для обучения модели был подготовлен датасет из 35 изображений с японской гравюрой Кацусики Хокусая. После установки нужных библиотек, для каждого из изображений автоматически создавалось текстовое описание с помощью модели BLIP. Все подписи сохранялись в файл metadata.jsonl, а к описаниям добавлялся стилевой токен hokusai_style.

Обучение проводилось методом DreamBooth LoRA на базе модели Stable Diffusion XL. В ходе обучения модель усваивала связь между токеном hokusai_style и визуальными особенностями датасета: плоскостной композицией, контурной линией, декоративной структурой изображения и природными мотивами.

После завершения обучения полученная LoRA-модель использовалась для генерации новой серии изображений по текстовым промптам.

Результирующая серия изображений

Серия объединена темой пейзажа: в работах повторяются мотивы моря, лодок, мостов, островков суши, облаков и горного силуэта (чаще всего Фудзи). За счёт этого итоговые изображения воспринимаются как единый цикл. При этом разнообразие композиции, масштаба, ритма и состояния природы придают каждой работе индивидуальность.

Original size 4961x2448
Original size 1024x1024

Модель успешно воспроизвела ключевые особенности выбранного стиля. Прежде всего это организация пространства. Оно строится слоями (передний, средний и дальний план).

Также, отсутствие линейной перспективы, чёткая контурная линия и декоративный характер изображения.

Особенно заметна передача ритма природных форм: волны, облака и линии берега организованы как повторяющиеся графические элементы. В некоторых изображениях доминирует динамика (волны, движение воды), в других — статичность и равновесие (спокойные пейзажи горой вдали)

В проекте использовался ChatGPT 5.2 для решения проблем, возникших во время написания кода и написания промптов.

Обучение модели LоRA на основе гравюр Кацусика Хокусая
Project created at 21.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more