Учёные нашли способ удвоить скорость вычислений компьютеров без замены железа
Новый подход к параллельным вычислениям, представленный на профильном симпозиуме IEEE/ACM, способен удвоить производительность любого процессора при одновременном снижении энергопотребления вдвое. Исследователи из Калифорнийского университета в Риверсайде (UCR) предложили технологию, которая заставляет все вычислительные блоки устройства — CPU, GPU, TPU и другие ускорители — работать не по очереди, а одновременно. В отличие от традиционных апгрейдов, этот метод не требует замены «железа»: достаточно изменить программную логику управления ресурсами.
Принцип «одновременной гетерогенной многопоточности»
Ключевая идея разработки, получившей название SHMT (Simultaneous and Heterogeneous Multithreading), заключается в отказе от устоявшейся модели, где в каждый момент времени вычисления выполняет только один тип процессора. Современные системы, даже оснащенные мощным GPU и специализированными тензорными блоками, по умолчанию используют их последовательно. Технология SHMT разбивает код на независимые высокоуровневые операции (HLOPs) и распределяет их между всеми доступными вычислительными компонентами платформы.
Управление этим процессом осуществляется через специальную политику планирования — quality-aware work-stealing (QAWS). Этот механизм не требует значительных вычислительных затрат, но позволяет динамически балансировать нагрузку и контролировать качество выполнения. Система создает набор виртуальных операций, группирует их и отправляет в очереди задач для каждого типа оборудования. Поскольку HLOPs не привязаны к конкретной архитектуре, система может перенаправлять задачи с одного компонента на другой в реальном времени.
Экспериментальная платформа и результаты
Для проверки эффективности исследователи собрали тестовый стенд на базе объединяющей платы с интерфейсом PCIe. В его состав вошел модуль NVIDIA Jetson Nano с четырехъядерным процессором ARM Cortex-A57 и 128 графическими ядрами Maxwell, а также ускоритель Google Edge TPU, подключенный через слот M.2 Key E. В качестве операционной среды использовалась Ubuntu Linux 18.04, а основная память объемом 4 Гбайт LPDDR4 служила общим хранилищем данных.
Запуск стандартных тестовых приложений с использованием фреймворка SHMT продемонстрировал впечатляющие результаты. При наиболее эффективной политике QAWS скорость вычислений увеличилась в 1,95 раза, а энергопотребление снизилось на 51% по сравнению с традиционным последовательным методом. Важно отметить, что все компоненты системы остались без изменений — прирост производительности и экономия энергии были достигнуты исключительно за счет оптимизации программного управления.
Сейчас технология требует доработки и пока не готова к коммерческому внедрению. Однако, по словам соавтора исследования Хунг-Вей Ценга, адъюнкт-профессора факультета электротехники и вычислительной техники UCR, для ускорения вычислений не нужно добавлять новые процессоры — они уже есть в каждом устройстве. Необходимо лишь научиться грамотно распоряжаться имеющимися аппаратными ресурсами, а не выстраивать их в очередь.
Предыдущие попытки эффективного распараллеливания вычислений на гетерогенных платформах сталкивались с проблемой несовместимости архитектур и сложностью синхронизации потоков. Большинство современных решений либо используют только один тип ускорителя для конкретной задачи, либо переключаются между ними с большими временными задержками. Разработка UCR впервые предлагает механизм, который позволяет задействовать все вычислительные блоки одновременно без потери качества и с минимальными накладными расходами.
Масштабирование этого подхода для использования в центрах обработки данных (ЦОД) обещает колоссальный экономический эффект. При существующих ценах на электроэнергию и оборудование снижение энергопотребления вдвое при одновременном удвоении производительности может кардинально изменить экономику облачных вычислений и высокопроизводительных кластеров. Технология не требует замены серверных стоек или закупки новых процессоров — достаточно обновить программное обеспечение и системы управления задачами. Это делает SHMT крайне привлекательной для операторов дата-центров, которые постоянно ищут способы повысить эффективность без капитальных затрат.















