Практикум по ИИ-рисованию, часть вторая
ИИ-генерация изображений перестала быть забавой для энтузиастов: технологии дорисовки (inpainting/outpainting) и интеллектуального масштабирования (upscaling) превращают сырые результаты Stable Diffusion в готовые арт-объекты высокого разрешения. Однако большинство пользователей сталкиваются с дилеммой: либо получать артефакты при примитивном растяжении картинки, либо тратить часы на ручную доводку в графических редакторах. Разбор реального кейса — превращения «средненького» стимпанк-робота в детализированное полотно размером 3584 × 2560 точек — демонстрирует, как с помощью бесплатных инструментов и связки Stable Diffusion + AUTOMATIC1111 можно добиться профессионального качества без художественного образования.
Почему базовая генерация — это только начало
Даже на мощном игровом ПК базовая модель Stable Diffusion 1.5 выдает изображения, которые редко проходят «тест обоями»: искаженные кисти рук, нелогичная перспектива, смазанные текстуры. Проблема усугубляется при попытке увеличить картинку — стандартные алгоритмы масштабирования (бикубическая интерполяция, фильтр Ланцоша) создают «мыло» и пиксельную зубчатость. Решение лежит в использовании специализированных чекпойнтов для дорисовки (inpainting-моделей) и апскейлеров, которые не просто растягивают изображение, а достраивают недостающие детали, обращаясь к латентному пространству нейросети.
Инструментарий: от выбора модели до настройки «вечной генерации»
Ключевой элемент рабочего процесса — модель Deliberate v2 и её inpainting-версия. В отличие от базового чекпойнта, она обучена не только генерировать новые объекты, но и органично вписывать их в существующий фон. Установка таких моделей в папку models AUTOMATIC1111 открывает доступ к функциям outpainting (дорисовка за границы исходного холста) и inpainting (перерисовка отдельных фрагментов внутри картинки). Режим «Generate Forever» позволяет запустить непрерывную серию генераций с разными сидами (seed), экономя время: система будет создавать варианты, пока пользователь не выберет удачный.
Для борьбы с артефактами — например, ложными «водяными знаками» или мусорными пикселями — применяется точечная перерисовка. Загрузив изображение на вкладку img2img, оператор вручную закрашивает дефектный участок маской, а модель заменяет его новым контентом, согласованным с окружением. Параметр Denoising strength регулирует степень вмешательства: от 0,25 (легкая коррекция) до 0,8 (полная замена фрагмента).
Апскейлинг без потери качества: как вырастить картинку в 4 раза
Увеличение разрешения — самый ресурсоемкий этап. Встроенные скрипты AUTOMATIC1111 требуют много видеопамяти, поэтому на картах с 8 Гбайт VRAM оптимально использовать расширение Ultimate SD upscale. Его принцип — разбиение изображения на тайлы (блоки), которые обрабатываются поочередно. Для двукратного увеличения (по площади — в 4 раза) при ширине тайла 128 пикселей и denoising strength 0,2 процесс на GTX 1070 занял около 70 минут. Второй проход с тайлами 256 пикселей увеличил время до 6 часов, но итоговое разрешение достигло 3584 × 2560 точек.
Критически важна синхронизация параметров: если при апскейле denoising strength снижен до 0,2, количество шагов сэмплинга (sampling steps) нужно поднять до 100–150, чтобы сохранить детализацию. Позитивная подсказка при масштабировании должна дублировать исходную — это гарантирует, что модель будет дорисовывать «бронзовые трубки» и «медные шестеренки», а не генерировать случайные текстуры.
Разобранный кейс наглядно показывает: современные инструменты ИИ-генерации позволяют получать изображения выставочного качества, обходясь без дорогого софта и лет обучения. Единственные ограничения — время вычислений и готовность экспериментировать с параметрами. Следующий шаг для тех, кто освоил базовый цикл «генерация — дорисовка — масштабирование», — работа с ControlNet для точного контроля поз и композиций, а также region prompt control для раздельного управления разными зонами холста.















