Original size 1653x2133

Обучение генеративной модели под стиль Николая Рерих

PROTECT STATUS: not protected
big
Original size 3307x2333

Идея проекта

Николай Рерих (1874–1947) — выдающийся русский художник, чьё творчество охватывает исторические, религиозные и философские темы. Он учился в Императорской Академии художеств под руководством Архипа Куинджи и рано заявил о себе как мастер символизма. Его картины часто обращаются к древнерусской истории, эпосу и духовным поискам человечества.

В начале XX века Рерих оформлял спектакли для Русского балета Дягилева, совмещая живопись и театральное искусство. Позже, путешествуя по Индии, Тибету и Гималаям, он создал серию пейзажей, наполненных мистикой Востока и поиском высших смыслов. Эти работы стали символом его философского взгляда на искусство как путь к внутреннему пробуждению. Рерих создал более 7000 полотен, многие из которых находятся в музеях России, Европы, Индии и США. Его стиль узнаваем по мощным композициям, декоративной цветовой гамме и глубокому символизму.

big
Original size 3307x2333

В технике Николая Рериха можно выделить следующие особенности:

1. Использование темперы для глубины и матовости цвета Рерих предпочитал темперу, что позволяло добиться плотных, бархатистых поверхностей с мягкими градиентами и эффектом внутреннего свечения, особенно в пейзажах и небесных пространствах. 2. Цвет как выразитель эмоций и символов Его палитра строилась на насыщенных и порой неестественных цветах — глубоких синих, алых, пурпурных и охристых тонах. Такие оттенки не только создавали яркие визуальные образы, но и несли эмоциональную нагрузку. 3. Четкие контуры в сочетании с декоративной плоскостностью Композиции строились с использованием ясных силуэтов и контуров, часто напоминающих эстетику иконописи. При этом фигуры и ландшафты оставались обобщёнными, плоскими, что усиливало декоративный эффект. 4. Статичная динамика и ритм композиции Несмотря на внешнюю неподвижность, картины наполнены внутренним движением — за счёт ритмического повторения форм, изогнутых линий и направленного взгляда персонажей. Это создавало медитативную и почти архитектурную структуру кадра. 5. Воздействие через символизм и атмосферу Рерих мастерски создавал атмосферу — от мистических гор до эпических сцен прошлого, где каждая деталь имела скрытый смысл.

Техника Рериха — это сочетание декоративности, символизма и глубокого эмоционального воздействия через цвет и форму.

Original size 3307x2333

В данном проекте нам необходимо обучить генеративную нейросеть для рисования картин в каком-то специфическом стиле. Я решила на примерах рассмотреть насколько точно ИИ может копировать стиль художника, используя те же образы и предметы, что и художник, в целях сравнения.

Процесс работы:

Этап 1: Подготовка среды и исходных данных На этом этапе устанавливаются необходимые библиотеки и проверяется наличие GPU. Организуется структура папок для проекта, загружаются изображения и выполняется их первичный просмотр для оценки качества и корректности материалов.

Этап 2: Создание аннотаций и метаданных Для каждого изображения подбирается или автоматически генерируется текстовое описание. Все описания объединяются в единый файл — metadata.json, который обеспечивает связь между визуальным содержанием и его смысловой интерпретацией, что критически важно для обучения модели.

Этап 3: Обучение модели На основе подготовленных данных запускается обучение модели Stable Diffusion XL с применением DreamBooth и LoRA. Используются технологии оптимизации (mixed precision, gradient checkpointing, обучение в 8-битах), позволяющие эффективно адаптировать модель под заданный стиль генерации изображений.

Original size 1446x880

Этап 4: Размещение модели на платформе Hugging Face Готовая модель загружается в репозиторий Hugging Face вместе с конфигурационными файлами, весами и подробным описанием. Также добавляются инструкции по запуску, что обеспечивает удобный доступ как для личного использования, так и для широкой аудитории.

Этап 5: Генерация изображений с помощью модели На заключительном этапе модель используется для создания новых изображений на основе текстовых запросов (prompts). С учётом стиля художника она интерпретирует текст и преобразует его в оригинальные визуальные образы.

Original size 1740x530

Мои генерации

Original size 3307x2333

Как видно по результатам, нейросеть успешно воспроизводит яркость, насыщенность и общую стилистику работ, однако заметно упрощает текстуру материалов и сглаживает сложные цветовые переходы, делая изображения более выразительными и обобщёнными.

Original size 3307x2333

Вывод исследования:

В ходе проекта удалось успешно сгенерировать изображения, точно передающие стилистику моего художника, что подтверждает эффективность использования нейросети Stable Diffusion XL для имитации авторского художественного подхода.

Применение генеративной модели

Для генерации промтов был использован ChatGPT.

Для решения проблем с кодом применялся инструмент Gemeni 2.5 Pro.

Обучение генеративной модели под стиль Николая Рерих