Original size 1140x1600

Обучение генеративной модели на лабрадорах

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

В рамках проекта мною были исследованы возможности генеративной модели применительно к созданию изображений лабрадоров. Интерес к данной породе собак послужил основанием для обращения к теме виртуального синтезированного образа.

В качестве исходного материала использовались предварительно отформатированные фотографии, репрезентирующие широкий спектр изображений лабрадора-ретривера, что позволило повысить качество генерируемых моделью результатов.

Референсы –– Исходные изображения

Original size 1657x750
0
Original size 1657x750

Сгенерированные изображения

Original size 1657x750
0

В ходе работы генеративная модель продемонстрировала ожидаемую эффективность, позволив синтезировать ряд изображений. Тем не менее, в процессе генерации были выявлены два аспекта, которые не удалось полностью контролировать:

  1. Влияние отдельных референсных изображений приводит к тому, что модель с определенной периодичностью воспроизводит ретриверов с нарушенными пропорциями головы.

  2. На отдельных сгенерированных изображениях наблюдается эффект некорректного добавления или редукции конечностей.

Original size 1657x750

Таким образом, можно сказать, что генеративная модель смогла хорошо уловить объект и поместить его в разные сцены, обеспечив минимальные потери в детализации и соблюдении пропорций.

Original size 1657x750

Процесс обучение генеративной модели

Обучение генеративной модели проходило в Google Collab. Процесс включал несколько этапов.

Сначала загружался подготовленный набор изображений, все фотографии были приведены к единому формату и размеру. Затем для них автоматически создавались текстовые описания с помощью модели BLIP.

После этого выполнялось обучение модели с использованием метода LoRA на базе архитектуры SDXL, а затем осуществлялась генерация изображений в заданном стиле. Для вычислений применялся графический процессор (GPU), что позволило ускорить работу.

Описание применения генеративной модели

Для улучшения генеративных функций я обращалась к модели DeepSeek, которая помогла мне подправить код промта и сделать генерации более реалистичными и минимализировать потерю детализации.

Обучение генеративной модели на лабрадорах
Project created at 23.03.2026