HOWTO: как установить и настроить собственный ИИ на игровом ПК

22 май 2023, 01:16

872

Запуск больших языковых моделей (LLM) на домашнем компьютере упирается в непреодолимое препятствие — катастрофическую нехватку видеопамяти. Если для работы с нейросетями генерации изображений, такими как Stable Diffusion, достаточно 4-8 Гбайт VRAM, то для адекватной работы с современными текстовыми моделями требуются сотни гигабайт. Эта проблема — не просто технический нюанс, а фундаментальное ограничение, которое проводит жесткую границу между любительскими экспериментами и профессиональным использованием ИИ.

Почему видеокарта решает всё?

Архитектура LLM требует выполнения триллионов простых, но массовых вычислительных операций. Центральный процессор (ЦП) с его несколькими ядрами и медленной оперативной памятью (DRAM) для этой задачи не годится. Задержки при передаче данных между ЦП и ОЗУ делают расчеты непозволительно долгими. Графический процессор (ГП), напротив, с тысячами ядер CUDA и сверхскоростной видеопамятью (VRAM) идеально приспособлен для параллельной обработки данных. Именно поэтому Stable Diffusion на ПК без дискретной видеокарты генерирует изображения десятками минут, а с современной RTX 4080 — за секунды.

Барьер в 320 Гбайт

Показательный пример — GPT-3.5, основа первого ChatGPT. Модель содержит 175 миллиардов параметров. Если каждый параметр кодировать 16-разрядным числом (float16), то для их одновременного размещения в VRAM потребуется более 320 Гбайт. Именно поэтому запустить полноценный ChatGPT на домашнем ПК невозможно. Существуют облегченные альтернативы вроде Alpaca (с 7, 13 и 30 млрд параметров), но качество генерируемого ими текста значительно уступает продуктам OpenAI.

Локальная установка Stable Diffusion: пошаговый план

В отличие от LLM, запустить нейросеть для генерации изображений на домашнем ПК вполне реально. Для этого потребуется видеокарта NVIDIA с минимум 4 Гбайт VRAM (или AMD с 8 Гбайт), 8 Гбайт ОЗУ и 20 Гбайт свободного места на диске. Процесс установки включает несколько ключевых этапов.

Подготовка окружения: Git и Python

Первый шаг — установка клиента Git. Это система контроля версий, которая позволяет загрузить работоспособную версию проекта AUTOMATIC1111 (самого популярного веб-интерфейса для Stable Diffusion) и гарантирует, что она не сломается при последующих обновлениях. После установки Git, через терминал (Git Bash) выполняется команда клонирования репозитория: git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.

Второй шаг — установка Python версии 3.10.6. Важно использовать именно эту версию, так как Stable Diffusion разрабатывалась на ней. В ходе установки необходимо обязательно отметить опцию «Add Python 3.10 to PATH».

Загрузка модели и первый запуск

Сама модель Stable Diffusion (чекпойнт) загружается отдельно с репозитория Hugging Face. Рекомендуется выбирать версию v-1-5-pruned-emaonly.safetensors (около 4,3 Гбайт). Файл помещается в папку /models/Stable-diffusion внутри установочного каталога. Запуск системы производится двойным кликом по файлу webui-user.bat. Первый запуск может занять 5-10 минут, так как система будет настраивать программное окружение.

Тонкая настройка для производительности

Для оптимальной работы в файл webui-user.bat необходимо добавить аргументы командной строки. Ключевые параметры:

--xformers — инструмент для ускорения вычислений, особенно полезный на видеокартах с менее чем 12 Гбайт VRAM.
--lowvram или --medvram — режимы экономии видеопамяти. --lowvram позволяет запустить модель даже на ГП с 2 Гбайт VRAM, но сильно замедляет работу. --medvram — более сбалансированный вариант.
--no-half-vae — решает проблему с черными изображениями на старых видеокартах (например, GTX серии 1000 и старше).

После сохранения изменений и перезапуска, веб-интерфейс становится доступен по адресу http://127.0.0.1:7860.

Разрыв между возможностями домашних ПК и требованиями современных ИИ-моделей продолжает расти. Если для генерации изображений достаточно игровой видеокарты среднего сегмента, то для работы с текстовыми моделями уровня GPT-4 требуются специализированные кластеры с десятками гигабайт VRAM. Это подчеркивает, что массовое внедрение ИИ в повседневную жизнь будет зависеть не только от развития алгоритмов, но и от появления доступных аппаратных решений, способных обрабатывать сотни миллиардов параметров без подключения к облачным серверам.

Опубликовано: Мировое обозрение Источник