что мы будем делать мы не будем обучать большую нейросеть с нуля. Мы будем обучаем LoRA — маленькую надстройку поверх SDXL, которая запоминает визуальный язык датасета
кратко перед работой: вам нужно: — собрать себе датасет — загрузить его в определенную папку на гугл диске — зарегистрироваться на huggingface (https://huggingface.co/) — подтвердить почту на huggingface
что такое датасет датасет это набор картинок-примеров, по которым модель «понимает», что именно вы хотите от неё получить.
!!! Модель!!! ничего не «понимает» как человек. Она смотрит на картинки и ищет повторяющиеся признаки:
что повторяется, то модель считает важным что случайно меняется, то модель считает неважным
Если в датасете везде синий цвет, белые силуэты и бумажная фактура — модель решит: «ага, это часть стиля» Если в датасете везде цветы — модель может решить: «ага, стиль = цветы» Если в датасете везде один и тот же человек в одной красной куртке — модель может решить: «человек = красная куртка».
хороший стилевой датасет: разные объекты + похожая техника разные композиции + похожая палитра разные сюжеты + похожая фактура
плохой стилевой датасет: везде только цветы везде только один человек везде только один ракурс везде одна и та же картинка с небольшими отличиями
сколько нужно картинок: минимум: 15-20 изображений нормально: 30-80 изображений определенно ту мач: 100+
ваш ход действий (умоляю ОЧЕНЬ важно, следите за регистром букв) — копируйте у меня здесь)
- открываем Google Drive (https://www.google.com/intx/ru/drive/)
- в «Мой диск» создаем папку AI_LORA_CLASS
- внутри AI_LORA_CLASS создаем папку своего проекта латиницей. Например: alena_collage или zayavlenie_na_otchislenie, или nazvanie_vashego_proekta, или любое иное название
- внутри папки проекта создаем папку dataset И папку output
- загружаем все изображения только в эту самую папку dataset
!!! кроме того что загружаем картинки в папку dataset больше ничего не трогаем! в аутпут ничего не кладем, лишних подпапок не создаем!!! ПРОБЕЛЫ В НАЗВАНИЯХ ПАПОК НЕ СТАВИТЬ. ставить только нижние подчеркивания.
наше приключение начинается по ссылке ниже. это блокнот в колабе, уже полностью подготовленный.
сюда нужно обязательно зайти и подтвердить что-либо во всплывающем окне, когда у вас уже будет аккаунт на хаггинфейс.
если после перехода по ссылке ничего никто вас не спрашивает, все в порядке, просто закрывайте окно.
здесь хранятся все коды (на всякий случай) и доп материалы.



