Original size 2118x3032

Обучение Stable Diffusion под графический стиль японских спичечных этикеток

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Бесспорно, Япония всемирно известна и своими гравюрами укиё-э, значительно повлиявшими на творчество европейских постимпрессионистов, и древним искусством кинцуги, подчеркивающим красоту дефектов, а также графикой суми-э, традицией каллиграфии, оригами, и многим другим. Тем не менее, в этом проекте мне захотелось уделить внимание более тихой и трогательной форме японской художественной мысли, а именно — графическому стилю такой утилитарной и повседневной вещи, как коробка спичек.

big
Original size 1024x661

Стиль японских спичечных коробок эпохи Мэйдзи (1868 — 1912) и Сёва (1926 — 1989) отличается уникальной палитрой, зернистостью печати и сочетанием восточной эстетики с западной типографикой. На этих коробках часто изображаются драконы и тигры, а бытовые сюжеты имеют флёр магического реализма из-за яркой палитры и динамики.

Меня сильно подкупила стилистика этих коробочек, где минимализм и максимализм словно сочетались в едином художественном языке.

Вдохновившись непосредственностью этой эстетики, мне захотелось создать что-то вроде оммажа этой эпохе в виде серии иллюстраций, посвященных винтажным упаковкам азиатских спичек.

Процесс обучения

Подготовив датасет, я загрузила его на Kaggle. Выбирая изображения, я старалась составить список наиболее колоритных картинок, по возможности несильно искаженных в качестве. Тем не менее, модель должна была «схватывать» характерную зернистость потертых временем ретро-картинок, чтобы результат был приближен к референсу.

Затем с использованием модели LoRA были направлены все референсы и промпты для анализа и обработки данных.

Original size 1360x578

Изначально обучение планировалось в Google Colab, однако из-за ограничения бесплатного доступа к GPU работа была перенесена в Kaggle Notebooks, где доступно до 30 часов GPU в неделю.

Original size 1596x302

Далее применялись промпты разной комплексности. В процессе работы я поняла, что за base_token удобнее было бы взять не «japanese vintage matchbox object in jmstyle», а «object in jmstyle» во избежание путаницы. Однако результатами генераций я осталась довольна.

Результаты обучения

Original size 1024x1024

С запросами сгенерировать конкретный образ, к примеру, дракона или тигра, модель справляется успешно. Удачно выходит изобразить и миниатюру на коробочке, и фрагмент иллюстрации.

У модели удачно получается генерировать спичечные коробки в заданной стилистике. Изображение пейзажей тоже дается ей легко. Палитра исходников и свойственный им минимализм здесь соблюдены. Тем не менее, эти генерации кажутся более современными, в них меньше зернистости, налета «ретро».

Original size 1024x1024

Здесь я попробовала сгенерировать пейзаж в стиле винтажной открытки, чтобы не уходить далеко от изначального стиля.

Мои любимые текстурные генерации — эти получившиеся абстракции. На мой взгляд, это было бы чудесной открыткой или иллюстрацией. К тому же, генерации все еще соблюдают заданную моделью цветовую палитру.

Временами модель выдавала фрагменты картинок, а не полный их план. Скорее всего, это связано с тем, что не все изображения в датасете были формата 1:1. Несмотря на это, мне нравится такая фрагментация, ведь она придает картинкам реалистичности — очень многие изображения с оформлением японских спичек были сняты именно так. Поэтому я считаю, что эксперимент вышел успешным.

Инструменты, использованные для реализации проекта:

Pinterest — сбор фотографий для датасета

Stable Diffusion — обучение генеративной нейросети под свой стиль

Kaggle Notebook — выполнение кода и генераций

Google Gemini — помощь в написании кода и промптов

Обучение Stable Diffusion под графический стиль японских спичечных этикеток
Project created at 24.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more