нейросетевые танцы с бубном на Dafes

что мы будем делать мы не будем обучать большую нейросеть с нуля. Мы будем обучаем LoRA — маленькую надстройку поверх SDXL, которая запоминает визуальный язык датасета

Исходный размер 1216x832

кратко перед работой: вам нужно: — собрать себе датасет — загрузить его в определенную папку на гугл диске — зарегистрироваться на huggingface (https://huggingface.co/) — подтвердить почту на huggingface

что такое датасет датасет это набор картинок-примеров, по которым модель «понимает», что именно вы хотите от неё получить.

!!! Модель!!! ничего не «понимает» как человек. Она смотрит на картинки и ищет повторяющиеся признаки:

что повторяется, то модель считает важным что случайно меняется, то модель считает неважным

Если в датасете везде синий цвет, белые силуэты и бумажная фактура — модель решит: «ага, это часть стиля» Если в датасете везде цветы — модель может решить: «ага, стиль = цветы» Если в датасете везде один и тот же человек в одной красной куртке — модель может решить: «человек = красная куртка».

хороший стилевой датасет: разные объекты + похожая техника разные композиции + похожая палитра разные сюжеты + похожая фактура

плохой стилевой датасет: везде только цветы везде только один человек везде только один ракурс везде одна и та же картинка с небольшими отличиями

сколько нужно картинок: минимум: 15-20 изображений нормально: 30-80 изображений определенно ту мач: 100+

ваш ход действий (умоляю ОЧЕНЬ важно, следите за регистром букв) — копируйте у меня здесь)

открываем Google Drive (https://www.google.com/intx/ru/drive/)
в «Мой диск» создаем папку AI_LORA_CLASS
внутри AI_LORA_CLASS создаем папку своего проекта латиницей. Например: alena_collage или zayavlenie_na_otchislenie, или nazvanie_vashego_proekta, или любое иное название
внутри папки проекта создаем папку dataset И папку output
загружаем все изображения только в эту самую папку dataset

!!! кроме того что загружаем картинки в папку dataset больше ничего не трогаем! в аутпут ничего не кладем, лишних подпапок не создаем!!! ПРОБЕЛЫ В НАЗВАНИЯХ ПАПОК НЕ СТАВИТЬ. ставить только нижние подчеркивания.

наше приключение начинается по ссылке ниже. это блокнот в колабе, уже полностью подготовленный.

блокнот для копирования

сюда нужно обязательно зайти и подтвердить что-либо во всплывающем окне, когда у вас уже будет аккаунт на хаггинфейс.

если после перехода по ссылке ничего никто вас не спрашивает, все в порядке, просто закрывайте окно.

просто зайти сюда после того как у вас есть аккаунт на хаггине

здесь хранятся все коды (на всякий случай) и доп материалы.

мануал. объяснения принципов работы ячеек

Исходный размер 1216x768