Ценовая политика, которую проводит NVIDIA в отношении ускорителей 40-й серии, настолько же последовательна, насколько возмутительна. Мало того, что новинки оказались дороже своих формальных предшественников, все они, за исключением флагманского RTX 4090, обеспечивают неудовлетворительную прибавку игрового быстродействия в пересчете на стоимость. Даже в самых выгодных, но по-прежнему честных условиях сравнения GeForce RTX 4070 может предложить лишь на 10 % больше FPS на доллар, чем RTX 3070, RTX 4070 Ti — на 16 % больше, чем RTX 3070 Ti, ну а 80-я модель линейки настолько подорожала, что стоимость FPS в лучшем случае осталась прежней. GeForce RTX 4080 частично оправдывает лишь абсолютный уровень производительности, недостижимый для любых устройств прошлого поколения.
В среднем ценовом сегменте, традиционно чувствительном к показателю FPS на доллар, такой подход не работает, но, как мы увидим по результатам тестирования GeForce RTX 4060 Ti, в NVIDIA считают иначе.
⇡#Графический процессор AD106
GeForce RTX 4060 Ti основан на графическом процессоре AD106, который ранее дебютировал в составе ноутбучных видеоадаптеров GeForce RTX 4070. От старших представителей семейства Ada Lovelace чип отличается лишь количественными параметрами, но отличия эти колоссальны. Так, кристалл содержит лишь три крупнейших масштабируемых блока архитектуры — GPC (Graphics Processing Cluster), что дает в общей сложности 36 потоковых мультипроцессоров или 4608 вещественночисленных ALU стандартной точности. Для сравнения: следующий по рангу чип AD104, который лежит в основе десктопных ускорителей GeForce RTX 4070 и RTX 4070 Ti, имеет 7680 шейдерных ALU — на 66 % больше.
Логика фиксированной функциональности включает 144 текстурных модуля, 48 ROP и 36 блоков трассировки лучей.
Важной особенностью архитектуры Ada является огромный кеш второго уровня, который позволил снизить требования GPU к пропускной способности внешней памяти. Кристалл AD106 имеет 32 Мбайт L2 и пользуется узкой 128-битной шиной VRAM. Кроме того, число линий PCI Express в продуктах на базе AD106 урезано с 16 до 8.
Производитель
NVIDIA
Название
AD107
AD106
AD104
AD103
AD102
Где используется
GeForce RTX 4060
GeForce RTX 4060 Ti
GeForce RTX 4070;
GeForce RTX 4070 Ti
GeForce RTX 4080
GeForce RTX 4090
Микроархитектура
Ada Lovelace
Ada Lovelace
Ada Lovelace
Ada Lovelace
Ada Lovelace
Техпроцесс, нм
TSMC 4N
TSMC 4N
TSMC 4N
TSMC 4N
TSMC 4N
Число транзисторов, млрд
18,9
22,9
35,8
45,9
76,3
Площадь чипа, мм2
146
190
295
378,6
608,6
Число SM/TPC/GPC
Streaming Multiprocessors (SM)
24
36
60
84
144
Thread Processing Clusters (TPC)
12
18
30
42
72
Graphics Processing Clusters (GPC)
3
3
5
7
12
Конфигурация потокового мультипроцессора (SM)
CUDA-ядра FP16
Нет
Нет
Нет
Нет
Нет
CUDA-ядра FP32
4 × 32
4 × 32
4 × 32
4 × 32
4 × 32
CUDA-ядра FP64
2
2
2
2
2
CUDA-ядра INT32
4 × 16
4 × 16
4 × 16
4 × 16
4 × 16
ALU специального назначения (SFU)
4 × 4
4 × 4
4 × 4
4 × 4
4 × 4
Тензорные ядра
4 × 1
4 × 1
4 × 1
4 × 1
4 × 1
RT-ядра
1
1
1
1
1
Блоки наложения текстур (TMU)
4
4
4
4
4
Объем регистрового файла, Кбайт
256
256
256
256
256
Объем кеша L1/разделяемой памяти, Кбайт
128
128
128
128
128
Программируемые вычислительные блоки GPU
CUDA-ядра FP16
Нет
Нет
Нет
Нет
Нет
CUDA-ядра FP32
3 072
4 608
7 680
10 752
18 432
CUDA-ядра FP64
48
72
120
168
288
CUDA-ядра INT32
1 536
2 304
3 840
5 376
9 216
ALU специального назначения (SFU)
384
576
960
1 344
2 304
Тензорные ядра
96
144
240
336
576
RT-ядра
24
36
60
84
144
Блоки GPU фиксированной функциональности
Блоки наложения текстур (TMU)
96
144
240
336
576
Блоки операций растеризации (ROP)
32
48
80
112
192
Конфигурация памяти
Объем кеша L2, Мбайт
24
32
48
64
96
Разрядность шины RAM, бит
128
128
192
256
384
Тип микросхем RAM
GDDR6 SGRAM
GDDR6 SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
GDDR6X SGRAM
Интерфейс NVLINK
Нет
Нет
Нет
Нет
Нет
Интерфейс PCI Express
4.0 x8
4.0 x8
4.0 x16
4.0 x16
4.0 x16
⇡#Технические характеристики, цены
Полностью функциональные чипы AD106 используются только в мобильной графике NVIDIA, в то время как десктопная версия GeForce RTX 4060 Ti утратила 2 из 36 потоковых мультипроцессоров и содержит лишь 4 352 действующих ALU FP32 и 136 блоков наложения текстур. Поразительно, но даже GeForce RTX 3060 Ti имеет более мощную формулу основных вычислительных компонентов. Однако благодаря фотолитографии TSMC 4N графический процессор AD106 работает на существенно больших тактовых частотах (расчетная частота под игровой нагрузкой составляет 2 535 МГц), и в результате GeForce RTX 4060 Ti превосходит RTX 3060 Ti на 36 % теоретического быстродействия, а оригинальную версию RTX 3070 — на 9 %.
При этом, несмотря на существенный прирост «сырой» вычислительной мощности, новая видеокарта довольствуется энергопотреблением в 160 Вт вместо 200 Вт, характерных для GeForce RTX 3060 Ti.
GeForce RTX 4060 Ti комплектуется памятью типа GDDR6 с пропускной способностью 18 Гбит/с, а ее объем составляет 8 либо 16 Гбайт. Релиз ускорителя с 16 Гбайт памяти назначен на июль текущего года, так что сегодня мы рассмотрим 8-гигабайтную модификацию, которая уже поступила в продажу. Заметим, что две версии GeForce RTX 4060 Ti не отличаются друг от друга ничем, кроме объема VRAM и, разумеется, цены.
RTX 4060 Ti 8 Гбайт назначили такую же рекомендованную стоимость, как у RTX 3060 Ti, — $399. Стало быть, это первое устройство во всей 40-й линейке, которое не стало дороже своего формального предшественника и при этом сулит значительную прибавку быстродействия. Впрочем, не будем делать тайны из того, что практика в данном случае расходится с теоретическими оценками. Ключевым фактором, который на самом деле отличает GeForce RTX 4060 Ti от RTX 3060 Ti, является полный комплект технологий DLSS 3.0, включая генерацию кадров. Последняя функция уже играет ведущую роль в маркетинге более дорогих представителей 40-го семейства: от RTX 4070 до RTX 4080, но RTX 4060 Ti, кажется, и вовсе неотделим от генерации кадров, а будущее новинки всецело зависит от того, как много игр примет ее на вооружение.
Масштабирование и генерация кадров также маскируют скромный объем VRAM, ведь при использовании DLSS рендеринг происходит в пониженном разрешении. Грядущая 16-гигабайтная версия GeForce RTX 4060 Ti застрахована от дефицита локальной памяти, однако и стоит на целых $100 больше базовой модели.
Производитель
NVIDIA
Модель
GeForce RTX 3060 (12 Гбайт)
GeForce RTX 3060 Ti
GeForce RTX 3070
GeForce RTX 4060
GeForce RTX 4060 Ti
GeForce RTX 4070
Графический процессор
Название
GA106
GA104
GA104
AD107
AD106
AD104
Микроархитектура
Ampere
Ampere
Ampere
Ada Lovelace
Ada Lovelace
Ada Lovelace
Техпроцесс
Samsung 8N
Samsung 8N
Samsung 8N
TSMC 4N
TSMC 4N
TSMC 4N
Число транзисторов, млрд
12
17,4
17,4
18,9
22,9
35,8
Тактовая частота, МГц: Base Clock / Boost Clock
1 320/1 777
1 410/1 665
1 500/1 725
1 830/2 460
2 310/2 535
1 920/2 475
Шейдерные ALU FP32
3 584
4 864
5 888
3 072
4 352
5 888
Блоки наложения текстур (TMU)
112
152
184
96
136
184
Блоки операций растеризации (ROP)
48
80
96
32
48
64
Тензорные ядра
112
152
184
96
136
184
RT-ядра
28
38
46
24
32
46
Оперативная память
Разрядность шины, бит
192
256
256
128
128
192
Тип микросхем
GDDR6 SGRAM
GDDR6 SGRAM
GDDR6 SGRAM
GDDR6 SGRAM
GDDR6 SGRAM
GDDR6X SGRAM
Тактовая частота, МГц (пропускная способность на контакт, Мбит/с)
1 875 (15 000)
1 750 (14 000)
1 750 (14 000)
1 063 (17 000)
1 125 (18 000)
1 313 (21 000)
Объем, Мбайт
12 288
8 192
8 192
8 192
8 192/16 384
12 228
Объем кеша L2, Мбайт
3
4
4
24
32
36
Шина ввода/вывода
PCI Express 4.0 x16
PCI Express 4.0 x16
PCI Express 4.0 x16
PCI Express 4.0 x8
PCI Express 4.0 x8
PCI Express 4.0 x16
Производительность
Пиковая производительность FP32, GFLOPS (из расчета максимальной указанной частоты)
12 738
16 197
20 314
15 114
22 065
29 146
Производительность FP64/FP32
1/64
1/64
1/64
1/64
1/64
1/64
Производительность FP16/FP32
1/1
1/1
1/1
1/1
1/1
1/1
Пропускная способность оперативной памяти, Гбайт/с
360
448
448
272
288
504
Вывод изображения
Интерфейсы вывода изображения
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
DisplayPort 1.4a, HDMI 2.1
TBP/TDP, Вт
170
200
220
115
160
200
Розничная цена (США, без налога), $
329 (рекоменд. в момент выхода)
399 (рекоменд. в момент выхода)
499 (рекоменд. в момент выхода)
299 (рекоменд. в момент выхода)
399/499 (рекоменд. в момент выхода)
599 (рекоменд. в момент выхода)
Розничная цена (Россия), руб.
32 990 (рекоменд. в момент выхода)
39 990 (рекоменд. в момент выхода)
45 490 (рекоменд. в момент выхода)
Н/Д
Н/Д
Н/Д
Главными соперниками GeForce RTX 4060 Ti в текущих условиях являются видеокарты прошлого поколения, поскольку свежий Radeon RX 7600 относится к более низкой категории производительности и цены. Минимальная стоимость новинки в России сейчас составляет 45 155 руб., в то время как GeForce RTX 3070 доступен за 41 990 (или даже меньше для тех, кто не гнушается сомнительными китайскими брендами), а Radeon RX 6700 XT подешевел до 33 тыс. руб. В свою очередь, ценовой диапазон RTX 3070 Ti и Radeon RX 6800 начинается с сумм 53 890 и 49 724 руб. соответственно.
Мы рассмотрим GeForce RTX 4060 Ti на примере ускорителя GIGABYTE EAGLE, который является одной из самых доступных реализаций новинки. Видеокарта существует в двух вариантах: с референсными тактовыми частотами либо номинальным заводским разгоном — 2 550 вместо 2 540 МГц. В период работы над обзором эти ускорители продавались за минимальную стоимость в 49 391 и 53 865 руб. соответственно.
⇡#Конструкция
Скромное энергопотребление GeForce RTX 4060 Ti располагает к компактному дизайну, но GIGABYTE EAGLE оборудован такой же крупной системой охлаждения, как у многих более производительных и горячих видеокарт. Устройство занимает в корпусе ПК два полных слота расширения и насчитывает 272 мм в длину.
Радиатор СО обслуживают три вентилятора с диаметром крыльчатки 77 мм. Средний вентилятор вращается в противоположном направлении относительно двух других, а самый дальний от видеовыходов продувает свой участок радиатора насквозь через окно в бэкплейте. Бэкплейт у GIGABYTE EAGLE пластиковый, а значит, выполняет только защитную функцию и не способствует охлаждению PCB. У видеокарты нет абсолютно никакой светодиодной подсветки.
GeForce RTX 4060 Ti, как и RTX 4070, использует для дополнительного питания не новый стандарт 12VHPWR, а обычный восьмиконтактный разъем.
Радиатор кулера собран по технологии прямого контакта между сплющенными секциями тепловых трубок и кристаллом GPU, которая в настоящее время считается признаком бюджетных устройств. Тепловых трубок всего три штуки, диаметром 6 мм, а для охлаждения микросхем GDDR6, силовых каскадов и дросселей VRM на радиаторе есть отдельные теплосъемники.
⇡#Печатная плата
Модели 40-й серии в диапазоне от GeForce RTX 4070 до RTX 4080 производители видеокарт часто собирают на очень похожих печатных платах. Напротив, сниженное энергопотребление и 128-битная шина памяти RTX 4060 Ti позволяют существенно упростить дизайн и комплектацию PCB.
На плате GIGABYTE EAGLE есть разводка для восьми фаз питания GPU, но задействованы лишь шесть фаз на основе силовых каскадов Alpha & Omega AOZ5311NQI с номинальным током 55A под управлением распространенного ШИМ-контроллера uP9512R от uPI Semiconductor. Питание чипов памяти однофазное и реализовано при помощи дискретных MOSFET’ов на 69 А.
Сами микросхемы VRAM, изготовленные Samsung, несут маркировку K4ZAF325BC-SC20, которая указывает на пропускную способность 20 Гбит/с.
У GIGABYTE EAGLE есть две копии BIOS, которые задают различные настройки скорости вращения вентиляторов: OC и Silent.