Original size 1140x1600

Обучение генеративной нейросети на машинах

PROTECT STATUS: not protected

ИДЕЯ ПРОЕКТА

post

Идея проекта заключается в исследовании возможностей генеративных моделей для создания изображений автомобилей в премиальной и спортивной стилистике. Основной концепт — работа с единым визуальным языком автомобильного дизайна, включающим агрессивные формы, чёткую геометрию и характерные элементы современных спорткаров.

В качестве исходных данных был использован набор изображений (датасет), включающий фотографии автомобилей премиального сегмента: с акцентом на тёмные цветовые решения, глянцевые поверхности, контрастные детали и выразительный дизайн кузова.

post

Все изображения были предварительно обработаны: — приведены к единому формату 1:1 — очищены от лишнего визуального шума — отобраны по принципу визуального сходства (единый стиль, ракурсы, освещение)

Данный датасет позволил задать модели чёткое представление о целевом визуальном стиле генерации и ключевых признаках автомобильной эстетики.

РЕФЕРЕНСЫ

ИТОГОВЫЕ ИЗОБРАЖЕНИЯ

post

В целом полученные изображения соответствуют изначальной идее проекта: нейросеть смогла передать общий стиль автомобильного дизайна и сохранить узнаваемые элементы формы.

Особенно хорошо читаются: — общий силуэт автомобилей — акцент на передней части (фары, решётка) — спортивные, немного агрессивные пропорции — контрастные и чистые цветовые решения

При этом видно, что модель не просто копирует исходные изображения, а комбинирует их. В результате появляются новые варианты автомобилей, которые выглядят реалистично, но при этом не существуют в реальности.

Также можно заметить: — упрощение некоторых мелких деталей — смешение элементов разных моделей — небольшую гиперболизацию форм (делает их более выразительными)

Таким образом, можно сказать, что нейросеть хорошо уловила общий визуальный стиль и смогла его воспроизвести, но работает больше на уровне обобщения, чем точной детализации

ПРОЦЕСС ОБУЧЕНИЯ

Обучение модели проводилось в среде Google Colab и включало несколько последовательных этапов.

На первом этапе загружался подготовленный датасет, где все изображения были предварительно приведены к единому формату и размеру. Далее для изображений автоматически генерировались текстовые описания с использованием модели BLIP.

После этого выполнялось обучение модели с применением метода LoRA на базе архитектуры SDXL, а также последующая генерация изображений, соответствующих заданному стилю.

Обучение осуществлялось с использованием графического процессора (GPU), что позволило значительно ускорить вычисления.

В процессе работы были выявлены ограничения, связанные с вычислительными ресурсами: модель периодически прерывала обучение из-за перегрузки. В связи с этим проводилась оптимизация кода и параметров обучения, включая снижение вычислительной нагрузки, что позволило обеспечить более стабильный процесс работы модели

Описание применения генеративной модели

Для оптимизации и уточнения финальных текстовых промптов использовался ChatGPT

Обучение генеративной нейросети на машинах
Project created at 23.03.2026
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more