Original size 1374x1920

Визуальный язык Хокусая в генеративной нейросети

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

В данном проекте проводится обучение генеративной нейросети Stable Diffusion XL с использованием метода DreamBooth LoRA на основе не популярных изображений японского художника Кацусики Хокусая.

Цель проекта — проверить, насколько модель способна воспроизводить характерные особенности художественного языка Хокусая: выразительную линию, плоскостность композиции, декоративность, природные мотивы, графичность волн, облаков и горных форм.

Пионы и воробей

Воздушный Колокольчик и Стрекоза

Примеры исходных изображений

Модель была обучена на датасете, включающем произведения художника в жанре японской гравюры укиё-э, что позволило передать характерные черты его художественного языка: выразительную линию, плоскостную композицию, ограниченную цветовую палитру и типичные мотивы, такие как морские волны, горные пейзажи, птицы и природные сцены.

Далее представлена серия изображений, полученных в результате обучения генеративной нейросети

Промпты: «hokusai style great ocean wave at sunset, dramatic sky, japanese ukiyo-e woodblock print», «hokusai style mountain landscape with clouds and wind, japanese ukiyo-e woodblock print»

Промпты: «hokusai style river and bridge, blue palette, japanese ukiyo-e woodblock print», «hokusai style storm over the sea, dynamic wave forms, japanese ukiyo-e woodblock print»

Промпты: «hokusai style storm over the sea, dynamic wave forms, japanese ukiyo-e woodblock print», «hokusai style fishing boats near coast, japanese woodblock print», «hokusai style village ne

Промпты: «hokusai style birds over water and clouds, japanese woodblock print», «hokusai style moonlit sea, elegant linework, japanese ukiyo-e print»

В результате обучения модель смогла перенять ряд характерных признаков художественного языка Хокусая.

В сгенерированных изображениях заметны: декоративная плоскостность композиции; выразительная контурная линия; ритмичная организация волн, облаков и горных форм; ограниченная, но узнаваемая цветовая палитра; характерная для японской гравюры графичность.

Процесс обучения нейросети

Для обучения модели был собран датасет из 20 изображений, кадрированных в формате 1:1

Original size 1266x604

Фрагмент кода

После загрузки датасета был выполнен этап настройки параметров обучения, включающий выбор конфигурации модели, оптимизацию гиперпараметров и подготовку вычислительной среды. Далее был запущен процесс обучения нейросети, в ходе которого модель последовательно анализировала изображения из датасета и адаптировала свои внутренние параметры

Original size 1266x593

Фрагмент кода

После этого была загружена обученная модель, с её помощью была сгенерирована итоговая серия изображений

Original size 1266x889

Фрагмент кода

Вывод

Итоговая серия изображений демонстрирует вариативность внутри одной стилистической системы. В разных генерациях меняются композиционные центры, природные элементы и пространственная организация, но сохраняется единый визуальный язык. Особенно хорошо модель передаёт движение воды, волнообразные формы, облака и пейзажные мотивы.

Это показывает, что LoRA-обучение может использоваться как инструмент исследования художественного языка и генерации новых визуальных вариаций на его основе.

Описание применения генеративной модели

В проекте использовался ChatGPT — для помощи в корректировке кода, структурировании ноутбука

Визуальный язык Хокусая в генеративной нейросети
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more