Original size 1240x1750

Обучение генеративной нейросети под авторский стиль

PROTECT STATUS: not protected
The project is taking part in the competition

Идея проекта

Исходные изображения для обучения

Я решила обучить нейросеть на собственный художественный стиль, чтобы увидеть, какие черты окажутся наиболее выразительными и сохранятся в итоговых генерациях.

В датасет попало 17 рисунков, в основном портретов.

Исходные изображения для обучения

Результирующая серия изображений

a woman with long blonde hair and a sword/ anime drawing, a woman with long blonde hair and a sword

Original size 1024x1024

eichi_v style, one cute white rabbit, sitting on a crescent moon

Для начала я сгенерировала несколько изображений с LoRA на максимальной интенсивности. Хотя черты стиля были узнаваемы, на генерациях присутствовало много артефактов и непонятных деталей.

lora_scale=0.5/lora_scale=0.75. «eichi_v style, one cute white rabbit, sitting on a crescent moon»

изображение из исходного датасета/"eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.75

Чтобы добиться лучших результатов, я протестировала разные значения lora_scale и изменения в промптах, добавив «simple anime drawing», так как стандартный SDXL склоняется к фотореализму. Лучше всего показали себя дополненные промпты и lora_scale 0,85. В этих генерациях стиль узнается, при этом артефактов значительно меньше, а лица проработаны точнее.

Original size 1024x1024

«eichi_v style, anime drawing, side profile of a man with flowing black hair, gold accents», lora_scale = 0.85

Original size 1024x1024

«eichi_v style, simple anime drawing, a woman with long blonde hair and a sword», lora_scale = 0.85

Небольшие артефакты всё же остались, но, думаю, это можно было бы исправить более длительным обучением и дополнительным файнтюнингом под простые аниме-иллюстрации.

simple anime drawing, a gir with pink hair, wearing sunglasses and smoking a cigarette/simple anime drawing, a man with pink hair, wearing sunglasses and smoking a cigarette

Процесс обучения

Перед началом обучения я обрезала все изображения под формат 1024×1024 с помощью сайта birme.net.

Original size 1806x560

Превью датасета

Original size 1829x451

Генерация подписей

После загрузки датасета в Colab были сгенерированы подписи. Обучение на 500 эпох заняло 40 минут.

Original size 1839x456

Обучение

Original size 1830x643

Генерация изображения

Обучение генеративной нейросети под авторский стиль
Project created at 24.03.2026