Лента новостей

14:21
Число украинских беженцев в Германии сократилось на 300 тысяч
14:20
DIW: Германия лишилась 200 млрд евро из-за конфликта на Украине
14:16
Не стало российского добровольца Андрея Морозова
13:50
Шендерович готов финансировать ВСУ
13:49
В России закрыли Киви банк. Средства на Qiwi-кошельках не застрахованы по системе страхования вкладов и уже заблокированы
13:43
Как человечеству навязывают тотальную цензуру?
13:41
Бывший российский владелец подал в суд на хельсинкскую верфь
13:39
ЕС одобрил 13-й пакет антироссийских санкций
13:23
Какими могут быть перспективные дроны-перехватчики
13:01
Путин отметил героизм летчиков на самых сложных участках фронта
12:58
Ка-52М поражает позицию ВСУ с помощью НАР С-8КОМ
12:33
Крупнейшие банки Китая перестали принимать платежи из России
12:25
Fox News: в 2014 году Байден требовал от Обамы заставить Россию «заплатить кровью» за Крым
12:23
Лавров: страны ЕС сами себе навязали вражду с Россией
12:22
Путин на аэродроме Чкаловский вручил госнаграды воинским частям ВКС России
11:55
Вернуть идеологию в Конституцию России? Инициатива свердловских чиновников
11:54
От Херсона до Читы: СБУ продолжает вербовку граждан, проживающих в России
11:48
США закрепляются в атомной энергетике Болгарии
11:45
МИД Китая назвал G20 не местом для решения геополитических вопросов
11:43
Захарова: вето США в ООН по резолюции по Газе демонстрирует истинное отношение к людям
11:09
Fox: Трамп назвал Россию «военной машиной», победившей Наполеона и Гитлера
10:53
Смерть предателя: версии и факты
10:40
Герасимов: Авдеевку взяли быстро, но долго к этому готовились
09:46
В Прибалтике задержали группу граждан России
09:34
Российская космическая угроза: запугать ради денег
09:27
США призвали Украину выбирать города, какие ещё сможет удержать ВСУ
09:26
Трамп: военная машина России победила Гитлера и Наполеона
09:24
Что падение Авдеевки означает для Украины, дальнейшей войны и для Европы
09:14
СВО. Донбасс. Оперативная лента за 21.02.2024
09:05
СМИ: британская субмарина провалила испытания МБР Трайдент-2
08:47
Нидерланды должны рассмотреть возможность прямой конфронтации с Россией
04:29
Связь Starlink в Вооружённых Силах России: риски, возможности, последствия
04:20
Кто такие петлюровцы
03:39
Что будет после Авдеевки?
00:43
Политзаключённые на Украине: люди, перед которыми мы в долгу
00:23
Личная гвардия Ленина
22:45
Шойгу доложил Путину о взятии Крынок, идет зачистка
21:38
В Одессе уволили женщину – водителя такси за просмотр российских сериалов
21:04
Строительство оборонительных сооружений сорвано по всей Украине
21:03
Грузия отказалась поддерживать санкции против РФ
20:42
Авдеевка показала, как могут быть освобождены Харьков, Запорожье, Херсон и Одесса
20:28
Украинцы искусственно себя калечат, чтобы откосить от призыва
20:27
Вопрос практически решён. Германия передаст Украине ракеты Taurus, США — ATACMS
20:26
Министр юстиции Украины настаивает на мобилизации заключенных
20:25
Украинские войска ведут огонь по ДНР и Белгородской области. Обзор ситуации в прифронтовых регионах России на вечер 20 февраля
Все новости

Архив публикаций



Мировое обозрение»Технологии»Китай создал 384-ядерный чип Sunway SW26010-Pro для суперкомпьютеров, который в 4 раза быстрее предшественника

Китай создал 384-ядерный чип Sunway SW26010-Pro для суперкомпьютеров, который в 4 раза быстрее предшественника


В этом году Национальный суперкомпьютерный центр в Уси (Китай) запустил мощнейший суперкомпьютер на базе усовершенствованных 384-ядерных процессоров Sunway SW26010-Pro, разработанных в стране. По сравнению с предшественником — 256-ядерной моделью Sunway SW26010 без приставки «Pro» — его производительность выросла до четырёх раз, сообщает ресурс Chips and Cheese.

 Источник изображения: top500.org

Источник изображения: top500.org

Впервые о процессоре Sunway SW26010-Pro и суперкомпьютерах на его основе стало известно ещё в 2021 году, но только в этом году на конференции по высокопроизводительным вычислениям SC23 разработчик публично продемонстрировал этот чип и рассказал о его архитектуре. Максимальная FP64-производительность каждого Sunway SW26010-Pro составляет 13,8 Тфлопс — для сравнения, 96-ядерный AMD EPYC 9654 демонстрирует около 5,4 Тфлопс.

Sunway SW26010-Pro основан на совершенно новой проприетарной RISC-архитектуре — он включает в себя шесть групп ядер (CG) и блок обработки протоколов (Protocol Processing Unit — PPU). Каждый CG-кластер объединяет 64 вычислительных ядра (Compute Processing Elements — CPE) с 512-битным векторным движком, 256 кбайт сверхскоростного кеша для данных и 16 кбайт для инструкций; одно управляющее ядро (Management Processing Element — MPE) — суперскалярное ядро внеочередного действия с векторным движком, по 32 Кбайт кеша L1 для данных и инструкций, 512 Кбайт кеша L2; а также 128-битный интерфейс памяти DDR4-3200.

 Источник изображения: chipsandcheese.com

Источник изображения: chipsandcheese.com

MPE и CPE используют протокол на основе директорий — он обеспечивает согласованный обмен данными, чтобы сократить объём их перемещения между ядрами и поддержать точное взаимодействие между ними. Это особенно важно для приложений с нерегулярным доступом к совместно используемым данным. Каждый 6-кластерный процессор имеет 384 вычислительных и 6 управляющих ядер — всего 390 ядер. Sunway SW26010-Pro отличается от предшественника более высокой скоростью работы (2,25 ГГц у CPE и 2,10 ГГц у MPE против 1,45 ГГц у обоих на предыдущей модели) и полностью переработанной 64-разрядной RISC-архитектурой, которая помогла увеличить FP64-производительность в четыре раза. Разработчик повысил пропускную способность памяти, заменив контроллеры DDR3 на DDR4. Если у предыдущей версии процессора на один CPE-кластер приходились 8 Гбайт DDR3, то сейчас это 16 Гбайт DDR4 — соответственно, общий объём поддерживаемой процессором памяти вырос с 32 Гбайт у SW26010 до 96 Гбайт в SW26010-Pro.

При этом, как отмечает Tom’s Hardware, слабым местом обоих версий процессора являются кеш и оперативная память. В модели SW26010-Pro проблему с кешем попытались решить, увеличив объём сверхскоростной памяти с 64 до 256 Кбайт, но при отсутствии надлежащего L2 этого всё равно недостаточно. Двухканальной подсистемы памяти DDR4-3200 (51,2 Гбайт/с), кроме того, едва хватает на 64 ядра, каждое из которых имеет 512-битный векторный FPU и обеспечивает производительность до 16 FP64-флопс за цикл. Проблему кеша можно частично компенсировать за счёт дорогостоящей и трудозатратной программной оптимизации, но с учётом недостаточной пропускной способности ОЗУ непонятно, насколько в итоге обновлённый процессор окажется эффективным для задач, которые призваны решать экзафлопсные суперкомпьютеры.



Опубликовано: Мировое обозрение     Источник

Подпишись:





Напишите ваш комментарий к статье:

Информация
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.

Новости партнеров

Наверх