NVIDIA GeForce RTX 3080 video card review, part 2: long-awaited tests / Video cards

NVIDIA GeForce RTX 3080 video card review, part 2: long-awaited tests / Video cards


The latest video cards of the GeForce RTX 30 series are pretty late on the way to the 3DNews editorial office – as much as we never imagined while working on the first part of the review devoted to the architecture of Ampere chips and all characteristics of consumer devices based on them. But now the first batches of GeForce RTX 3080 have finally flowed into Russia in a thin stream, and we got the opportunity to test the RTX 3080 in practice, answering all questions of concern to readers, except for one: how much the advanced accelerators will actually cost. The plans of IT publications to publish reviews are not the only ones affected by the pandemic. It is said that complications in relations between the United States and China contributed to the shortage of the RTX 3080, but the main culprit is the incredible excitement around new products. It’s almost impossible to just pick up and buy a GeForce RTX 3080. Gamers who have rushed to get off the hands of the GeForce RTX 2080 Ti, at best, will have to wait in line for pre-order in any of the foreign online stores – stocks there ran out within hours, if not minutes, after NVIDIA gave the go-ahead at the start of sales, and the prices naturally (and much) exceed the $ 699 recommended by Santa Clara. Needless to say, the RTX 3080 in Russia – at least at first – will be expensive. But it’s not in vain that the buyers are so pounced on the fresh NVIDIA accelerators? This is what we are going to find out today.

However, we will immediately warn you that if you are interested not only in analyzing the performance of the GeForce RTX 3080, but also in getting to know the Founders Edition video cards, you will have to wait a little longer with this. Branded devices will be released later than partner variants of the RTX 3080, although this is fair in its own way. This time, the Founders Edition is extremely far from what was previously called reference boards and is a limited product for connoisseurs of beauty that would never have cost $ 699 in retail if it had been designed and sold by one of the company’s partners instead of NVIDIA.

We’re delighted that the GeForce RTX 3080 is featuring the Palit device in the first benchmarks on 3DNews. Under this brand, the most affordable modifications of a particular video card on the Russian market have appeared more than once. And although the RTX 3080 fundamentally cannot be cheap, the Palit GeForce RTX 3080 GamingPro OC will demonstrate what a buyer can count on, who in the current environment still intends to save money.

⇡ #GeForce RTX 3080 specifications

Although we paid increased attention to the official specifications of GeForce 30 series video cards in the architectural part of the review, it does not hurt to remind readers what kind of monster we are dealing with in the person of GeForce RTX 3080 and the GA102 GPU.

The fully functional GA102 chip has seven GPCs (Graphics Processing Clusters, the largest scalable array components) versus six in the TU102. Each of them still contains 12 Streaming Multiprocessors, only the set of 32-bit CUDA cores that process real numbers has been doubled inside SM. As a result, the GA102 main execution unit formula includes 10,496 FP32-compatible CUDA cores and 336 texture mapping units.

However, the GeForce RTX 3080 got a significantly reduced version of the GA102, in which only six active GPC modules remained. Besides, two of them are not fully equipped with SMs. As a result, the GeForce RTX 3080 has 8,704 shader ALUs for FP32 operations and 272 texture mapping units. However, this is still a huge reserve of raw computing power compared to the top 20-series models: the GeForce RTX 2080 SUPER and RTX 2080 Ti have only 3,072 and 4,352 FP32 CUDA cores, respectively. We recommend that you turn to the first part of the review to find out how NVIDIA managed to squeeze so many shader ALUs onto the die, without going beyond the already colossal component budget of 28 billion transistors.

In order to satisfy the GA102’s need for fast data access, the GeForce RTX 3080 and RTX 3090 video cards are equipped with a new type of RAM GDDR6X, which in the case of the RTX 3080 provides a bandwidth of 19 Gbps per bus pin versus 14 or 16 Gigabit GDDR6, which prevails in previous generation accelerators. At the same time, the total memory bandwidth of the RTX 3080, despite the bus cut to 320 bits, reaches 760 GB / s. More – only for GeForce RTX 3090 (960 GB / s) and Radeon VII (1 TB / s). Only 10 GB of RAM can cause slight concerns, although formally and in fact the weaker GeForce RTX 2080 Ti has 12 GB of VRAM.

Manufacturer NVIDIA
Model GeForce RTX 2080 GeForce RTX 2080 SUPER GeForce RTX 2080 Ti TITAN RTX GeForce RTX 3080 GeForce RTX 3090
GPU
Name TU104 TU104 TU102 TU102 GA102 GA102
Microarchitecture Turing Turing Turing Turing Ampere Ampere
Technical process 12 nm FFN 12 nm FFN 12 nm FFN 12 nm FFN 8 nm (8N) 8 nm (8N)
Number of transistors, million 13 600 13 600 18 600 18 600 28300 28300
Clock frequency, MHz: Base Clock / Boost Clock 1,515/1 710 (Founders Edition: 1,515/1 800) 1,650/1 815 1 350/1 545 (Founders Edition: 1 350/1 635) 1 350/1 770 ND / 1 710 ND / 1 695
Shader ALU 2944 3072 4 352 4608 8704 10496
Texture Mapping Units (TMU) 184 192 272 288 272 328
Rasterization Operations Blocks (ROPs) 64 64 88 96 96 112
Tensor cores 368 384 544 576 272 328
RT cores 46 48 68 72 68 82
RAM
Bus width, bit 256 256 352 384 320 384
Chip type GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6 SGRAM GDDR6X SGRAM GDDR6X SGRAM
Clock frequency, MHz (bandwidth per contact, Mbps) 1,750 (14,000) 1,937.5 (15,500) 1,750 (14,000) 1,750 (14,000) 1,188 (19,000) 1,219 (19,500)
Volume, MB 8 192 8 192 11264 24,576 10 240 24,576
I / O bus PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 3.0 x16 PCI Express 4.0 x16 PCI Express 4.0 x16
Performance
Peak performance FP32, GFLOPS (based on maximum specified frequency) 10 069/10 598 (Founders Edition) 11151 13 448/14 231 (Founders Edition) 16312 29768 35 581
FP64 / FP32 performance 1/32 1/32 1/32 1/32 1/32 1/32
FP16 / FP32 performance 2/1 2/1 2/1 2/1 1/1 1/1
RAM bandwidth, GB / s 448 496 616 672 760 936
Image output
Image output interfaces DisplayPort 1.4a, HDMI 2.0b DL DVI-D, DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.0b DisplayPort 1.4a, HDMI 2.1 DisplayPort 1.4a, HDMI 2.1
TBP / TDP, W 215/225 (Founders Edition) 250 250/260 (Founders Edition) 280 320 350
Retail price (USA, excluding tax), $ 699 (recommended) / 799 (Founders Edition) – at the time of release 699 (recommended at the time of release) 999 (recommended) / 1 199 (Founders Edition) – at the time of release 2499 699 (recommended at the time of release) 1499 (recommended at the time of release)
Retail price (Russia), rub. 63,990 (Founders Edition at time of release) 56 990 (recommended at the time of release) 95,990 (Founders Edition at time of release) 221,990 (at the time of release) 63 490 (nvidia.ru) 136 990 (nvidia.ru)

However, the actual consumption of on-board video card memory by modern games is a delicate topic that is not disclosed by the estimates of occupied gigabytes in monitoring GPU-Z or MSI Afterburner. For now, 10 GB of GeForce RTX 3080 RAM should be enough for any tasks of an ordinary user, including games on a 4K screen with maximum detail settings. However, the practice of recent years suggests that for a long service life without an upgrade, it is better to recruit VRAM with a margin. It is not for nothing that versions of the GeForce RTX 3080 with 20 GB GDDR6X are already looming on the horizon, which, obviously, will make additional adjustments to the price picture of the 30th series. Also, let’s leave beyond the scope of the review such a question as the influence of two different generations of the PCI Express interface on the work of the new NVIDIA tops. The consensus is that PCIe 4.0 does not bring any practical advantage in games, although it gives AMD an extra opportunity to highlight the advantages of the AM4 platform. Professional applications, especially those that can use several GPUs at the same time, are another matter, but we will leave this to the discretion of specialists in tasks such as deep learning.

Be that as it may, the official performance data for the GeForce RTX 3080 is such that the new product provides twice the frame rate compared to the base version of the GeForce RTX 2080 – in conditions ideal for the Ampere architecture, that is, at 4K resolution and with ray tracing. , but nonetheless. We intend to find out if the RTX 3080 will fulfill such a request, and at the same time check what is the actual power consumption of the accelerator. Whatever one may say, NVIDIA single-chip gaming boards for the first time passed the 300W mark, and after all, the RTX 3080 is not even the flagship of the series. But first, let’s take a close look at the video card, which was honored to present a new architecture in the first tests – Palit GeForce RTX 3080 GamingPro OC.

⇡ #Palit GeForce RTX 3080 GamingPro OC: design, scope of delivery

NVIDIA and AMD partners do not like to release video cards without at least nominal overclocking. That’s why Pait GamingPro carries the OC index in its name because the graphics processor in it, albeit just a little bit, is still overclocked. Overclocking is reduced to an additional 30 MHz of the design clock frequency under the gaming load (Boost Clock), so the specifications of the accelerator can be quite equated to the reference ones from a practical point of view.

All the more impressive is the cooling system that Palit installed on the GA102 chip. The video card occupies three full expansion slots in the PC case, which not all varieties of GeForce RTX 2080 could afford, including those that are overclocked by more than Pait GamingPro. No wonder the company has attached an acrylic support to its product, which keeps the free edge of the board in a horizontal position.

However, the cooler of the Palit version of the GeForce RTX 3080 is interesting not only for its dimensions. When all eyes are on the Founders Edition video cards, which set standards, if not in cooling efficiency (we will find out in due time), then certainly in aesthetics, NVIDIA partners who cannot afford to spend more than $ 150 on a cooler alone (rumored , this is exactly the amount that the production of CO for one Founders Edition board costs), tend to somehow stand out from the crowd.

When viewed from the front, the Palit GeForce RTX 3080 GamingPro OC is nothing extraordinary: it seems that we have a regular cooler with three 95 mm fans, only very thick. There is also an almost mandatory RGB backlight for modern high-performance video cards.

But if you flip the graphics card over, you can make sure that the airflow from the right fan passes through the heatsink array and the plate on the back of the PCB – just like in the Founders Edition. We will not be surprised if other manufacturers follow NVIDIA’s example in this detail not so much out of a desire to imitate the trendsetter, but because the circuitry of accelerators with GDDR6X memory requires placing RAM chips as close as possible to the GPU and thus disposes them to short printed circuit boards. We have already seen such an approach to the cooling system design once performed by SAPPHIRE – also based on a short PCB of Radeon R9 Fury accelerators.

By the way, we cannot but praise Palit for the fact that the plate on top of the PCB is not made of useless and even harmful plastic for cooling, but of aluminum and is pressed against the PCB through several thermal pads.

Under the casing of the cooling system, there is a quite typical, unless adjusted for size, two-section radiator, pierced with several thick heat pipes. A nickel-plated copper base removes heat from the GPU crystal, and the memory chips and VRM power stages are in contact with the massive metal frame.

The cooler GeForce RTX 3080 GamingPro OC looks like a powerful one for a graphics card with a nominal power consumption of 320 W and, as we can see, is both high efficiency and low noise. When the GPU temperature is less than 60 ° C, it does not need active cooling at all, and the fans stop rotating. The only complaint that can be made about the design of this video card (and many others too) is that the cooling system leaves all the spent hot air inside the PC case. With such a device, when the radiator fins run parallel to the grille at the end of the casing, it could well have been replaced with a blank plate with cutouts only for video output connectors – nothing would have changed from this.

Speaking of the video outputs of the GeForce RTX 3080, the absence of a USB Type-C connector with DisplayLink support, which is typical of the 20th series accelerators, is not a measure of savings on the part of Palit. This standard, designed to connect VR headsets with a single wire, as they say, did not take off and was eventually rejected by NVIDIA.

⇡ #Palit GeForce RTX 3080 GamingPro OC: printed circuit board

As we mentioned at the very beginning, it is incorrect to call the Founders Edition versions of the GeForce 30 series as reference devices. Nevertheless, NVIDIA provides partners with a real reference PCB design to help organize the production of first wave video cards with proprietary cooling systems, and under the cooler of a budget accelerator you can sometimes find the reference motherboard itself with NVIDIA markings. The Palit GeForce RTX 3080 GamingPro OC PCB is pretty much the same: the photos of a few more PCBs for GA102 chips that surfaced on the Internet are similar to what you see in the photos, and are obviously variations on the same theme.

Be that as it may, for the average buyer not interested in competitive overclocking, there is hardly a reason to find fault with the RTX 3080 GamingPro OC board. The reference design allows for 16-phase power supply of the GPU using two eight-phase On Semiconductor NCP81610 controllers, although in this case only five power stages of one VRM are soldered on the board. GDDR6X memory is allocated up to four phases, but the components of two of them, again, are missing. The power phases of the GPU are powered by AOZ5311NQI power stages from Alpha & Omega with a rated current of 50 A.

The Palit GeForce RTX 3080 GamingPro OC PCB needs no further comment. The Founders Edition accelerators serve a VRM consisting of a total of 18 phases, they use exclusively solid-state capacitors, but among the partner varieties of the RTX 3080 and RTX 3090 we will see this design more than once – a cheaper, but well-equipped – design.

⇡ #Test stand, testing methodology

Test stand
CPU Intel Core i9-9900K (4.9GHz, 4.8GHz in AVX, Fixed Frequency)
Motherboard ASUS MAXIMUS XI APEX
RAM G.Skill Trident Z RGB F4-3200C14D-16GTZR, 2 x 8 GB (3200 MHz, CL14)
ROM Intel SSD 760p, 1024 GB
Power Supply Corsair AX1200i 1200W
CPU cooling system Corsair Hydro Series H115i
Housing CoolerMaster Test Bench V1.0
Monitor NEC EA244UHD
operating system Windows 10 Pro x64
AMD GPU Software
All graphics cards AMD Radeon Software Adrenalin 2020 Edition 20.8.3
NVIDIA GPU Software
All graphics cards NVIDIA GeForce Game Ready Driver 456.16
Games
Game (in order of release date) API Test Method Graphics settings Full screen anti-aliasing
Strange brigade Vulkan Built-in benchmark Max. graphics quality AA Ultra
Shadow of the tomb raider DirectX 12 Built-in benchmark Max. quality of graphics. DXR off, DLSS off TAA
Assassin’s creed odyssey DirectX 11 Built-in benchmark Max. graphics quality AA High (TAA)
Battlefield v DirectX 12 Mission Liberte + OCAT Max. quality of graphics. DXR off, DLSS off TAA High
Metro Exodus DirectX 12 Built-in benchmark Max. quality of graphics. DXR off, DLSS off, Shading Rate 100% TAA
Total War: THREE KINGDOMS DirectX 12 Built-in benchmark (Battle Benchmark) Max. graphics quality TAA
Control DirectX 12 OCAT Max. graphics quality TAA
Borderlands 3 DirectX 12 Built-in benchmark Max. graphics quality TAA
Red dead redemption 2 Vulkan Built-in benchmark Max. graphics quality TAA High
DOOM Eternal Vulkan Mars Core + OCAT mission start Max. graphics quality TAA
Games (with ray tracing)
Game (in order of release date) API Test Method Full screen anti-aliasing
Battlefield v DirectX 12 Liberté + OCAT mission Max. quality of graphics. DXR Raytrace Reflection Quality: Ultra TAA / DLSS
Shadow of the tomb raider DirectX 12 Built-in benchmark Max. quality of graphics. Ray Traced Shadows Quality: Ultra TAA / DLSS
Metro exodus DirectX 12 Built-in benchmark Max. quality of graphics. Shading Rate 100%. Ray Trace: Ultra TAA / DLSS
Quake II RTX Vulkan Timedemo, recording demo1.dm2 Max. graphics quality TAA
Control DirectX 12 OCAT Ray Tracing Preset: High TAA / DLSS 2.0
Minecraft with RTX Beta DirectX 12 Benchmark in the world of Portal Pioneers + OCAT Max. rendering range of geometry and particles No / DLSS 2.0

In most test games, the average and minimum frame rates are derived from the array of individual frame render times, which is recorded by the built-in benchmark (or the OCAT utility if it is not available).

The average frame rate in the charts is the reciprocal of the average frame time. To estimate the minimum frame rate, the number of frames formed in each second of the test is calculated. From this array of numbers, the value corresponding to the 1st percentile of the distribution is selected. Red Dead Redemption 2 is an exception: its built-in benchmark registers the 1st percentile of the frame’s render time, from which the corresponding frame rate is derived.

General Purpose Computing, Video Encoding / Decoding
Приложение Настройки API
AMD NVIDIA AMD NVIDIA
Adobe Premiere Pro CC 2020 PugetBench for Premiere Pro 0.88 GPU Effects: живое воспроизведение (ProRes 422, 4K@59,94 FPS) OpenCL CUDA
GPU Effects: экспорт в H.264 40 Мбит/с и ProRes 422HQ (4K@59,94 FPS)
Blender 2.9 Демо Class Room с сайта Blender Foundation Рендерер Cycles. Feature Set: Supported. Размер тайла: 256 × 256 OpenCL CUDA/OptX
Демо Nissan GTR от AMD Рендерер AMD Radeon ProRender OpenCL
DXVA Checker 4.1.2, Decode Benchmark H.264 (Microsoft H264 Video Decoder) 1920 × 1080 (High Profile, L4.1); 3840 × 2160 (High Profile, L5.1) D3D11VA
H.265 (Microsoft HEVC Video Extensions) 1920 × 1080 (Main Profile, L4.0); 3840 × 2160 (Main Profile, L5.0); 7680 × 4320 (Main Profile, L6.0)
VP9 (Microsoft VP9 Video Extensions) 1920 × 1080; 3840 × 2160; 7680 × 4320
FFmpeg 4.2.1, кодирование H.264 1920 × 1080 -c:v h264_amf -quality speed -coder cabac -level 4.1 -refs 1 -b:v 3M -c:v h264_nvenc -preset fast -coder cabac -level 4.1 -refs 1 -b:v 3M AMF NVENC
3840 × 2160 -c:v h264_amf -quality speed -coder cabac -level 5.1 -refs 1 -b:v 7.5M -c:v h264_nvenc -preset fast -coder cabac -level 5.1 -refs 1 -b:v 7.5M
FFmpeg 4.2.1, кодирование H.265 1920 × 1080 -c:v hevc_amf -quality speed -level 4 -b:v 3M -c:v hevc_nvenc -preset fast -level 4 -b:v 3M
3840 × 2160 -c:v hevc_amf -quality speed -level 5 -b:v 7.5M -c:v hevc_nvenc -preset fast -level 5 -b:v 7.5M
7680 × 4320 Н/Д -c:v hevc_nvenc -preset fast -level 6 -refs 1 -b:v 20M
REDCINE-X PRO Декодирование файлов RED R3D с разрешением 4К, 6К и 8К OpenCL CUDA

Мощность видеокарт регистрируется отдельно от CPU и прочих компонентов ПК с помощью амперметра JUNTEK VAT-1050 и устройства NVIDIA PCAT. Чтобы одновременно измерить ток, проходящий по разъемам дополнительного питания и слоту материнской платы, видеокарта подключается через жесткий райзер PCI Express x16, в котором линии питания разорваны и выведены на отдельный кабель.

В качестве нагрузки для тестов мощности и уровня шума используется игра Crysis 3 при разрешении 3840 × 2160 без полноэкранного сглаживания и при максимальных параметрах качества графики, а также стресс-тест FurMark с наиболее агрессивными настройками (разрешение 3840 × 2160, MSAA 8x). Замеры всех параметров выполняются после прогрева видеокарты, когда температура GPU и тактовые частоты стабилизируются.

⇡ #Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт);
  • NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) ;
  • NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) ;
  • NVIDIA GeForce GTX 1080 FE (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) ;
  • AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) ;
  • AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) .

Прим. В скобках после названий видеокарт указаны базовая и boost-частота согласно спецификациям каждого устройства. Видеокарты нереференсного дизайна приведены в соответствие с референсными параметрам (или приближены к последним) при условии, что это можно сделать без ручной правки кривой тактовых частот. В противном случае (ускорители серии NVIDIA GeForce 16, а также GeForce RTX 2070/2080/2080 Ti Founders Edition) используются настройки производителя.

⇡ #Тактовые частоты, энергопотребление, температура, уровень шума и разгон

Прежде чем приступить к бенчмаркам Palit RTX 3080 GamingPro OC, хотим рассказать о пополнении в нашем тестовом инструментарии. Вместе с комплектом LDAT, который позволяет регистрировать время задержки между вводом и реакцией изображения в играх, мы получили от NVIDIA новое средство измерения потребляемой мощности для плат расширения PCI Express под названием PCAT (Power Capture Analysis Tool).

В большинстве обзоров графических ускорителей используются косвенные методы оценки энергопотребления — при помощи программных инструментов драйвера видеокарты или чаще всего по совокупной мощности компьютера, — которые не позволяют проводить точное сравнение устройств различных производителей и рассчитывать такой показатель, как быстродействие на ватт мощности, характеризующий новые достижения в проектировании GPU. Так, современные видеокарты на чипах NVIDIA способны отдавать через API данные о своем общем энергопотреблении (включая оперативную память, вентиляторы охлаждения и потери КПД на преобразование напряжения) благодаря тому, что для контроля мощности в них применяются шунты на всех линиях 12 В. В то же время система питания ускорителей AMD устроена проще и позволяет отслеживать лишь мощность самого графического процессора на выходе силовых каскадов VRM без учета остальных компонентов. Ну а замеры полной мощности системы бытовым ваттметром, очевидно, не дают возможности исключить из уравнения неодинаковую загрузку центрального процессора при использовании GPU различных классов производительности.

Единственный способ раз и навсегда устранить перечисленные ограничения состоит в том, чтобы изолировать питание видеокарты от материнской платы тестового стенда и контролировать ток непосредственно между подопытным устройством и БП. В обзорах новых GPU мы уже не первый год следуем именно такой методике, когда видеокарта подключается к материнской плате жестким райзером, в котором разорваны линии питания, а весь ток и, следовательно, потребляемая мощность измеряется универсальным цифровым ваттметром при помощи шунта, рассчитанного на несколько сотен ватт.

Инструмент PCAT работает точно таким же образом. Он состоит из платы микроконтроллера с восьмиконтактными разъемами питания PCI Express и переходника, изолирующего видеокарту от материнской платы. Таким образом все питание поступает на ускоритель через PCAT, а микроконтроллер регистрирует ток, проходящий через кабели и слот PCI Express. Для оценки энергопотребления на глазок у PCAT есть миниатюрный OLED-экран, но в отличие от нашего ваттметра устройство NVIDIA можно подключить к компьютеру по USB и записывать лог потребляемой мощности — совокупной или, если требуется, мощности слота PCI Express и разъемов дополнительного питания в отдельности.

Заметим, что программное обеспечение PCAT, как и LDAT, не обязательно запускать на тестовом компьютере, а в том случае, когда оно работает на отдельной машине, у PCAT нет никакой возможности узнать, какое именно железо мы тестируем. Соответственно, не стоит волноваться о том, получат ли ускорители AMD справедливые оценки мощности в сравнении с новинками NVIDIA. Что касается точности измерения, то замеры энергопотребления видеокарт под нагрузкой с помощью PCAT не разошлись с показателями наших собственных инструментов, откалиброванных по падению напряжения на шунте, более чем на 2 %. Так что на первых порах мы смело можем оперировать старыми и новыми данными вперемешку, но в обзорах всех будущих GPU целиком перейдем на PCAT. В конце концов, инструмент NVIDIA намного удобнее в работе, не говоря о том, что выглядит куда симпатичнее наших самоделок.

Однако вернемся к Palit RTX 3080 GamingPro OC. Как мы уже заметили, перед нами разогнанный вариант GeForce RTX 3080, но оверклокинг в данном случае сводится к чисто символической величине 30 МГц по частоте Boost Clock, а резерв мощности видеокарты соответствует референсным 320 Вт. Как следствие, заводской разгон видеокарты не должен исказить общую картину сравнения GeForce RTX 3080 с другими ускорителями, все из которых представлены в бенчмарках референсными моделями.

NVIDIA оценивает диапазон тактовых частот GeForce RTX 3080 более консервативно, чем у его формальных предшественников — RTX 2080 и RTX 2080 SUPER. В действительности так оно и есть, хотя дистанция между устойчивой тактовой частотой ядра Palit RTX 3080 GamingPro OC и GeForce RTX 2080 SUPER Founders Edition оказалась немногим больше 50 МГц (1854 и 1907 МГц соответственно) под мощной нагрузкой в Crysis 3. Да, мы по-прежнему используем эту игру в качестве стресс-теста: достаточно сказать, что RTX 3080 стал первым ускорителем на нашей практике, который добился в Crysis 3 фреймрейта 60 FPS при разрешении 4К (даже без полноэкранного сглаживания MSAA!). А вот по сравнению с чипом TU102 на плате GeForce RTX 2080 Ti новый GPU тактуется на 131 МГц выше невзирая на полуторакратную разницу в транзисторных бюджетах. Жаль только, что универсальные программные инструменты для мониторинга и разгона видеокарт еще не получили доступ к датчикам питающего напряжения GPU, чтобы мы узнали, как смена техпроцесса подействовала на этот параметр.

Парадоксально, что NVIDIA раздала (избранным IT-изданиям, но тем не менее) комплекты для измерения мощности ускорителей именно в то время, когда ее потребительские устройства достигли беспрецедентно высоких TDP. Но может быть, в том-то и дело, что мы проверим мощность Ampere на практике и убедимся, что она не так страшна, как следует из его официальных ТТХ. Увы, по крайней мере Palit RTX 3080 GamingPro OC действительно расходует не меньше 314 из положенных по паспорту 320 Вт мощности. Единственная видеокарта, не считая «двухголовых» устройств, в нашей базе данных, которая превосходит по мощности RTX 3080, это Radeon RX Vega 64 с штатной СЖО, а все предыдущие топ-модели NVIDIA (включая 250-ваттные RTX 2080 SUPER и RTX 2080 Ti) новинка оставила далеко позади.

При таком внушительном энергопотреблении и, следовательно, тепловыделении GPU, нужно отдать должное системе охлаждения Palit. Температура в пределах 70 °C под нагрузкой еще не является признаком качества — просто именно так настроена автоматика кулера, а вот удержать уровень шума на уровне 38 дБА (ниже, чем у старших моделей Founders Edition прошлого поколения) куда сложнее.

Рабочие параметры под нагрузкой (Crysis 3)
Видеокарта Настройки Тактовая частота GPU, МГц Напряжение питания GPU, В Частота вращения вентиляторов, об/мин (% от макс.) Частота вращения вентиляторов 2, об/мин (% от макс.)
Средн. Макс. Средн. Макс. Средн. Средн.
Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) 1854 1950 Н/Д Н/Д 1823 (46%) 1823 (46%)
Palit GeForce RTX 3080 GamingPro OC (+50 МГц, 21,2 Гбит/с, 10 Гбайт) +9% мощности 1940 2010 Н/Д Н/Д 1894 (48%) 1894 (48%)
NVIDIA GeForce GTX 1080 Ti FE (1480/1582 МГц, 11000 Мбит/с, 11 Гбайт) 1735 1810 0,96 1,01 2377 (50%) Н/Д
NVIDIA GeForce RTX 2080 SUPER FE (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) 1907 1920 1,03 1,04 1969 (53%) 1969 (53%)
NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) 1723 1860 0,91 1,03 2082 (56%) 2082 (56%)
AMD Radeon VII (1800 МГц, 2000 Мбит/с, 16 Гбайт) 1756 1786 Н/Д Н/Д 2617 (Н/Д) Н/Д
AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт) Термопаста ARCTIC MX-2 1795 1819 1,07 1,18 2102 (43%) Н/Д

Прим. Измерение всех параметров выполняется после прогрева GPU и стабилизации тактовых частот.

Мы не питали больших надежд на оверклокинг GeForce RTX 3080 и, как показал опыт, видеокарта действительно не поддается разгону, который выражается в сколько-нибудь значимом приросте игрового быстродействия. Начнем с того, что прошивка Palit GamingPro OC позволяет лишь на 9 % увеличить резерв мощности платы, который является главным препятствием для наращивания тактовых частот графического процессора. А в рамках установленного TDP автоматика GPU Boost уже практически исчерпывает частотный потенциал. Нам удалось добавить 50 МГц к проектной частоте Boost Clock, что выражается в 85 МГц реальной тактовой частоты под игровой нагрузкой (5 % от исходных 1854 МГц). Надо ли говорить, что это капля в море, которая едва ли повлияет даже на самые чувствительные бенчмарки. К тому же, оверклокинг графического ядра влечет за собой рост и без того чрезвычайно высокой потребляемой мощности на 19 Вт — к счастью, хотя бы без последствий для температуры и шума системы охлаждения.

Быть может, в GeForce RTX 3080 выгоднее разгонять оперативную память? Задел для оверклокинга чипов GDDR6X со штатной пропускной способностью 19 Гбит/с, которые применяются в GeForce RTX 3080, существует, но раскрыть его не так-то просто. Для того, чтобы найти предел стандартных чипов GDDR6 при неизменных таймингах, достаточно постепенно увеличивать тактовую частоту, пока видеокарта не потеряет стабильность или не появятся графические артефакты на экране. GDDR6X ведет себя коварно: поначалу мы смогли довести пропускную способность чипов до 21,8 Гбит/с на контакт, но скоро обнаружили, что чем дальше она уходит за пределы 21,2 Гбит/с, тем сильнее не возрастает, а наоборот, падает производительность. Возможно, к делу подключились те самые алгоритмы настройки сигнала в шине GDDR6X, о которых говорила NVIDIA, поддерживающие стабильность даже в условиях сильной деградации соотношения сигнал-шум.

Кстати, GPU-Z и подобные программы некорректно определяют командную частоту GDDR6X на уровне 1 188 МГц, хотя на самом деле она вдвое выше. Если в будущем не исправят эту ошибку, привыкайте умножать число на 16, а не на 8, как с GDDR6, чтобы получить итоговую пропускную способность чипов.

⇡ #Игровые тесты ( 1920 × 1080)

Постоянные читатели железного раздела 3DNews наверняка заметили, что состав тестовой методики для новых GPU сильно изменился. Мы исключили из программы синтетическую нагрузку — как 3DMark в разделе игрового 3D-рендеринга, так и аналогичные тесты вычислений общего назначения. Да, 3DMark неплохо подходит для того, чтобы быстро оценить разницу между близкими по характеристикам видеокартами. Но когда речь идет о новом поколении графических процессоров, которое претендует на качественно иной уровень производительности, изучать «попугаи» в 3DMark не имеет никакого смысла. Он давно перестал быть альтернативой играм, основанных на разных графических движках и работающих с разными API, и порой изрядно расходится с действительностью в оценках GPU той или иной архитектуры. Бенчмарки с трассировкой лучей и масштабированием DLSS в 3DMark неплохо иллюстрировали возможности ускорителей GeForce RTX 20-й серии в их первые месяцы, но теперь вдобавок к играм, использующим богатые функции «гибридного» рендеринга, появились полностью трассированные модификации Quake II и Minecraft. В итоге мы решили упразднить тесты в 3DMark и вместо них расширить арсенал настоящих игр, который теперь наполовину состоит из проектов, поддерживающих трассировку лучей в том или ином объеме.

С другой стороны, нужно пояснить, почему в списке тестов отсутствуют некоторые игровые новинки 2020 года, отличившиеся высокими запросами к железу и на первый взгляд идеально подходящие для проверки таких устройств, как GeForce RTX 3080. Речь идет о Horizon Zero Dawn и Microsoft Flight Simulator, которым на 3DNews посвящены масштабные сравнительные тесты. Дело в том, что обе игры вышли на PC относительно недавно, и пока не отличаются высокой стабильностью вообще и быстродействия в частности. Рисковать повторяемостью результатов бенчмарков ради того, чтобы тестовая методика состояла из самых свежих игр, мы не готовы, так что Horizon Zero Dawn и MSFS придется постоять в очереди, пока не закончится первая волна патчей, исправляющих ошибки.

Итак, приступим к анализу тестовых результатов в стартовом разрешении 1080p, которое, честно говоря, совершенно не подходит для того, чтобы раскрыть потенциал ускорителей класса GeForce RTX 3080. А жаль, ведь именно в таком режиме современное железо может развивать кадровую частоту свыше 100 FPS не только в легких киберспортивных играх, но и в требовательных ААА-проектах, что положительно сказывается на времени реакции — особенно на экране с высокой частотой. Недавно мы отдельно разбирали этот вопрос в ходе аппаратного тестирования задержек с помощью LDAT и пришли к выводу, что FPS полезно наращивать за пределы частоты обновления монитора, будь у вас даже сверхскоростная матрица 240 Гц. Увы, среди тестовых игр только DOOM Eternal и Strange Brigade являются таким счастливым исключением.

Тем не менее, даже в таких условиях GeForce RTX 3080 обеспечивает существенную прибавку в 23 % усредненной кадровой частоты по сравнению с бывшим флагманом потребительских видеокарт NVIDIA, GeForce RTX 2080 Ti, а если сравнивать с RTX 2080 SUPER, речь идет от дополнительных 38 % FPS. Наконец, старшие модели позапрошлого поколения — GTX 1080 и GTX 1080 Ti — новинка превосходит на целых 110 и 67 % соответственно. Нечего и говорить о «красных» топах до предстоящего релиза чипов Navi второй волны: GeForce RTX 2080 одержал победу над Radeon VII и Radeon RX 5700 XT с преимуществом в 64 и 69 %.

⇡ #Игровые тесты (2560 × 1440)

Переход к разрешению 1440p позволил мощным видеокартам вздохнуть свободнее, но соотношение между GeForce RTX 3080 и старшими моделями серии RTX 20 от этого принципиально не изменилось. Ускоритель на чипе Ampere превосходит GeForce RTX 2080 SUPER и RTX 2080 Ti по среднему FPS на 46 и 29 % соответственно. Другое дело, если сравнить RTX 3080 с прошлым поколением видеокарт NVIDIA: отрыв от GeForce GTX 1080 и GTX 1080 Ti увеличился до впечатляющих 134 и 79 %. То же касается «красных» ускорителей средне-высокой ценовой категории на базе современной архитектуры RDNA, представленных Radeon RX 5700 XT: RTX 3080 превосходит последний уже на 80 % FPS.

⇡ #Игровые тесты (3840 × 2160)

Тесты на 4К-экране должны поставить точку в сравнении ускорителей 30-й серии с их ближайшими предшественниками. В таких условиях бутылочным горлышком системы становится именно графический, а не центральный процессор. К тому же, коль скоро старшие модели поколения Turing считаются видеокартами, подходящими для разрешения 2160p, их эстафету должны перенять все три новинки от GeForce RTX 3070 до RTX 3090.

Тем не менее, игровая графика тоже не стоит на месте. Хотя мы больше не используем в бенчмарках ресурсоемкое полноэкранное сглаживание MSAA и подобного типа, которое повсеместно вытеснили легковесные разновидности TAA, только в шести из десяти тестовых проектов средняя частота смены кадров на GeForce RTX 3080 перевалила за 60 FPS. Прошло уже семь лет с тех пор, как NVIDIA и AMD официально открыли эпоху гейминга в 4К, а избавить передовые игры на максималках от костылей в виде масштабирования кадра с помощью DLSS или FidelityFX CAS по-прежнему невозможно. Хотя, справедливости ради, среди всех игр только в Total War: THREE KINGDOMS — очередной серии вечно тормозящей стратегии — новый ускоритель не удержал фреймрейт как минимум на уровне 50 FPS.

Как ни крути, RTX 3080 все-таки сделал большой шаг к цели сделать 4К безоговорочно играбельным режимом, достигнув 55-процентного преимущества перед GeForce RTX 2080 SUPER. Конечно, это еще не такие рекордные показатели роста быстродействия между поколениями GPU, какими отличились ускорители семейства Pascal: к примеру, GeForce GTX 1080 в таких же условиях оказался на 72 % быстрее GeForce GTX 980. Однако нужно сделать поправку на то, что в то время чипмейкеры совершили гигантский прорыв в технологии производства GPU с нормы 28 нм к 14/16-нанометровой фотолитографии. Свидетелями такого прироста быстродействия мы вряд ли станем в обозримом будущем, если только TSMC и Samsung не столкнутся с очередным кризисом масштабирования транзисторов. С другой стороны, стоит учесть, что в отличие от GeForce RTX 2080 и RTX 2080 SUPER новый GeForce RTX 3080 основан на чипе первого эшелона, пусть и сильно урезанном по числу активных исполнительных блоков, так что и спрос с него выше, чем с того же RTX 2080, который сумел предложить лишь на 37 % больше FPS по сравнению со своим прямым предшественником GeForce GTX 1080.

Любопытно, что именно в 37 % средней кадровой частоты оценивается разница между GeForce RTX 3080 и GeForce RTX 2080 Ti. Вряд ли даже такие числа убедят пользователей бывшей топ-модели в необходимости срочного апгрейда (предприимчивые читатели добавят, что от RTX 2080 Ti нужно было избавиться заранее, пока еще не рухнули цены), а вот перспектива замены GeForce GTX 1080 или даже GeForce GTX 1080 Ti на RTX 3080 для игры в 4К выглядит чрезвычайно привлекательно. Как ни крути, ему рукой подать до отметки 60 FPS в таких невероятно тяжелых играх, как Red Dead Redemption 2, при максимальном качестве графики, но и во всех остальных случаях RTX 3080 превосходит старшие модели семейства Pascal по среднему фреймрейту в 2–2,5 раза.

⇡ #Игровые тесты в разгоне

От жалких 5 % кадровой частоты GPU, которые мы смогли выжать из Palit RTX 3080 GamingPro OC в попытках оверклокинга, не приходится ожидать сколько-нибудь значительного влияния на игровую производительность. Оперативная память GDDR6X в RTX 3080 оказалась более перспективной целью для разгона: в конце концов, нам удалось увеличить ее пропускную способность с 19 до 21,2 Гбит/с на контакт шины, а это составляет целых 16 % от ее штатных характеристик. Как следствие, если мы сможем найти в бенчмарках разогнанного RTX 3080 какую-то полезную информацию, она будет ответом на вопрос, хватает ли урезанному чипу GA102 общей ПСП в 760 Гбайт/с, которой его наделила NVIDIA.

Как выяснилось, хватает, и наверняка с большим запасом. Почти во всех тестах при разрешении 4К дополнительная ПСП и символически разогнанный графический процессор принесли GeForce RTX 3080 ровно 1 % фреймрейта (что, кстати, говорит о надежности тестовой методики, в которую мы включили игры с наиболее стабильным быстродействием). Нечего и говорить, что при более низком разрешении разгон целиком будет перекрыт процессорозависимостью игр и погрешностью измерения. Не исключаем, что в будущем нам еще попадутся варианты GeForce RTX 3080, благосклонные к разгону, но уже сейчас можно предсказать, что за рамками самых экстремальных случаев это бессмысленная затея.

⇡ #Игровые тесты с трассировкой лучей

GeForce RTX 3080 уже продемонстрировал нешуточный рост быстродействия в бенчмарках с традиционным растеризационным 3D-рендерингом, но мы ожидали получить самые яркие результаты в тестах игрового рейтрейсинга. В конце концов, именно рывок скорости трассировки лучей должен стать кульминацией всех изменений, которые NVIDIA заложила в архитектуру Ampere.

Так и получилось. Если не брать в расчет масштабирование кадра при помощи DLSS, RTX 3080 гораздо лучше выдерживает лавинообразный рост вычислительной нагрузки, который вызывает трассировка лучей. Как следствие, между новинкой и топовыми ускорителями 20-й серии возникает значительная дистанция даже при условно низком разрешении 1080p: согласно результатам шести бенчмарков RTX 3080 на 48 % превосходит GeForce RTX 2080 SUPER и на 27 % — RTX 2080 Ti. Если двигаться дальше к режиму 1440p, разрыв увеличивается до 55 и 34 % соответственно, и достигает пика в 4К с показателями 69 и 39 %. Вот теперь мы наконец-то имеем дело с ростом быстродействия по золотым стандартам архитектуры Pascal!

Впрочем, сила Ampere не столько в относительных, сколько в абсолютных числах. При разрешении 1440p трассировка лучей помешала GeForce RTX 3080 закрепиться на отметке 60 FPS только в бенчмарке Metro Exodus, и даже полностью трассированые модификации Quake II RTX и Minecraft ускоритель переварил без всяких проблем. Конечно, говорить о возможности игры с трассировкой лучей и без тормозов в честном 4К все еще преждевременно, но благодаря GeForce RTX 3080 это стало возможным по крайней мере в Battlefield V и, с некоторой натяжкой, в Shadow of the Tomb Raider.

Благо, почти все игры, поддерживающие DXR (или библиотеки рейтрейсинга в API Vulkan), одновременно позволяют использовать DLSS. Технология масштабирования кадров при помощи нейросети прошла огромный путь от первых, откровенно неудачных реализаций в Battlefield V и Metro Exodus и научилась выдавать картинку, которую с трудом удается отличить невооруженным глазом от честного полнокадрового рендеринга. А вот в таких условиях достижения GeForce RTX 3080 уже не настолько впечатляют, как то, что мы увидели до этого. Не все игры позволяют включить DLSS на мощных ускорителях при разрешении экрана ниже 1440p или 2160p (отсюда нули в итоговых таблицах), но всегда действует одно правило: GeForce RTX 2080 и RTX 2080 Ti благодаря DLSS подтягиваются к GeForce RTX 3080 так, что в 4К преимущество новинки перед ее предшественниками сжимается до 52 и 30 % соответственно. Это по-прежнему сильный результат, но о достойных пресловутого «Паскаля» 69 и 39 % речь уже не идет.

⇡ #Вычисления общего назначения

Видеокарты на чипах Turing отлично чувствовали себя в задачах, связанных с расчетами общего назначения. Несмотря на игровую ориентацию GeForce 20-й серии, именно в сфере GP-GPU, где до того явным фаворитом была логика GCN от AMD, эта архитектура принесла наибольшие дивиденды. В этот раз NVIDIA обязана как минимум закрепить, а в лучшем случае повторить прошлый успех, ведь сырая вычислительная мощность Ampere благодаря громадному количеству шейдерных ALU и переработанным блокам трассировки лучей вышла на совершенно иной уровень.

Не все приложения одинаково эффективно распоряжаются ресурсами GPU, но уже в Adobe Premiere Pro новый ускоритель способен существенно уменьшить время рендеринга 4К-видео со сложными графическими эффектами по сравнению с рабочими станциями на GeForce RTX 2080 SUPER, а разница между Ampere и Pascal так и вовсе просто колоссальная («красные» видеокарты, как и следовало ожидать, держатся лучше). Заметим, что в этом тесте не используется возможность кодирования H.264 и H.265 силами аппаратного медиадвижка NVENC — нас интересует только производительность самого GPU.

Лучше всего мощь архитектуры Ampere раскрывают задачи оффлайнового рейтрейсинга — такие как рендеринг в Blender на движке Cycles. Здесь GeForce RTX 3080 продемонстрировал более чем двукратное преимущество в скорости отрисовки сцены перед «Тьюрингами» и Radeon VII, неважно проводится ли рендеринг с использованием RT-ядер или исключительно софтверным методом. Впрочем, движок Radeon ProRender, который мы используем в качестве альтернативы строго тайловым рендеререам наподобие Cycles, не был настолько же впечатлен достижениями Ampere.

Прим. Для тестов новых видеокарт мы перешли на актуальную релизную версию Blender — 2.9 — и обнаружили, что Radeon RX 5700 XT снова потерял возможность работать с движком Cycles.

Напоследок прокомментируем результаты бенчмарка, использующего не только шейдерные ALU графического процессора, но и тензорные ядра — в данном случае для дебайеринга видеозаписей, снятых на профессиональную камеру RED. Здесь мы не ожидали от Ampere каких-либо чудес, ведь сильнейший рост пропускной способности на одно тензорное ядро новая архитектура сулит только в работе со структурно-разреженными сетями. Действительно, замена одного из старших «Тьюрингов» на GeForce RTX 3080 не повлияет на скорость декодирования R3D при разрешении 8К, но вот полоска 6К и, в особенности, 4К на графике просто выстреливает вперед.

Ускорители на чипах Ampere, вне всяких сомнений, должны вызвать большой интерес не только у геймеров, но и у профессионалов, занимающихся обработкой аудиовизуального контента. Однако более подробные тесты новых видеокарт мы приберегли для GeForce RTX 3090, который представляет собой скорее профессиональную, нежели игровую видеокарту.

⇡ #Кодирование/декодирование видео

Еще одним нововведением среди вычислительных функций кремния Ampere является декодирование видео стандарта AV1 силами специализированного ASIC NVDEC. Пожалуй, это первый кодек, настолько требовательный к вычислительным ресурсам, что распаковка потока AV1 при высоком разрешении, для которого он и предназначен, с плавной частотой смены кадров выходит за пределы возможностей мощного восьмиядерного CPU, не говоря уже о ноутбучных процессорах. Чипы Ampere решают проблему за счет быстрого аппаратного декодирования, но проверить эту функцию самостоятельно мы пока не можем: в большинстве программных кодировщиков поддержка AV1 еще не вышла из экспериментальной стадии и либо вовсе не позволяет создавать ролики с разрешением 8К, либо это происходит чрезвычайно медленно и занимает вплоть до нескольких суток на один файл.

Ну а пока мы обнаружили, что обновленный NVDEC существенно прибавил в скорости декодирования «старых» форматов HEVC и VP9, пусть она и без того была избыточно высокой для просмотра фильмов. Резерв нужен GPU для декодирования нескольких потоков в профессиональных задачах, а также быстрого перекодирования видео в другой формат с привлечением CPU или на связке NVDEC + NVENC. Кстати, NVENC не претерпел абсолютно никаких изменений в Ampere — это по-прежнему самый быстрый аппаратный кодировщик H.264 и HEVC, который можно найти в графических и центральных процессорах.

⇡ #Производительность на ватт и площадь GPU

О том, какие численные преимущества дал NVIDIA переход на техпроцесс 8 нм, преждевременно говорить, пока мы не провели тесты GeForce RTX 3090. Как ни крути, чип GA102 в составе RTX 3080 значительно урезали, а это не лучшим образом сказывается на его энергоэффективности. Тем не менее, если сфокусироваться не на процессорах, а на конкретных устройствах, можно сделать определенные предварительные выкладки. Во-первых, производительность на ватт у GeForce RTX 3080 все-таки увеличилась по сравнению с RTX 2080 SUPER, основанным на полностью функциональном чипе TU104, причем изрядно — на 21 %. А вот по сравнению с RTX 2080 Ti — всего лишь на 9 %, хотя, повторимся, здесь нужно отталкиваться от результатов RTX 3090.

Ну а самое главное, по удельному быстродействию на фоне RTX 3080 очень бледно смотрится не только Radeon VII, но и Radeon RX 5700 XT. Новинка обеспечивает на 40 % больше FPS в пересчете на ватт потребляемой мощности, хотя оба чипа — и GA102, и Navi 10 — производятся по технологическим нормам одного класса. Конечно, сравнивать по энергоэффективности GPU настолько разного масштаба не вполне корректно. Тем более, мы знаем, что Radeon RX 5700 XT подвело сильно завышенное напряжение питания GPU. Но во всяком случае ясно, что AMD уже нельзя повторять подобных ошибок, если она намерена преодолеть технологическое отставание в одно поколение GPU и сделать из чипов Navi второго поколения конкурентов для NVIDIA Ampere.

Производитель NVIDIA AMD
Модель GeForce RTX 3080 GeForce GTX 1080 Ti GeForce RTX 2080 SUPER GeForce RTX 2080 Ti FE Radeon VII Radeon RX 5700 XT
Графический процессор GA102 GP102 TU104 TU102 Vega 20 XL Navi 10 XT
Микроархитектура Ampere Pascal Turing Turing GCN 5 поколения RDNA
Техпроцесс, нм 8 нм (8N) 16 нм FFN 12 нм FFN 12 нм FFN 7 нм FinFET 7 нм FinFET
Число транзисторов, млн 28 300 12 000 13 600 18 600 13 200 10 300
Площадь чипа, кв. мм 628 471 545 754 331 251
Средняя потребляемая мощность (Crysis 3), Вт 314 216 244 250 286 219
Производительность/Вт 100% −44% −17% −8% −38% −28%
Производительность/млн транзисторов 100% −9% +34% +11% +21% +37%
Производительность/кв. мм 100% −49% −26% −39% +7% +25%
Производительность/Вт (обратное сравнение) 100% +79% +21% +9% +61% +40%
Производительность/млн транзисторов (обратное сравнение) 100% +10% −25% −10% −17% −27%
Производительность/кв. мм (обратное сравнение) 100% +95% +35% +64% −7% −20%

⇡ #Результаты игровых тестов и рекомендованные цены

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)
Assassin’s Creed Odyssey TAA High 78 / 100 55 / 62 67 / 76 70 / 81 74 / 90 56 / 68 51 / 67
Battlefield V TAA High 153 / 177 107 / 127 124 / 140 147 / 159 154 / 168 133 / 154 125 / 151
Borderlands 3 TAA 124 / 142 55 / 63 72 / 83 83 / 94 96 / 109 80 / 89 81 / 89
Control TAA 137 / 152 59 / 63 78 / 83 96 / 105 110 / 121 87 / 95 78 / 87
DOOM Eternal TAA 189 / 295 71 / 122 87 / 156 141 / 221 153 / 233 102 / 167 106 / 171
Metro Exodus TAA 56 / 96 25 / 45 32 / 58 39 / 69 46 / 79 30 / 54 30 / 54
Red Dead Redemption 2 TAA High 77 / 84 29 / 31 38 / 41 49 / 54 56 / 62 40 / 44 38 / 42
Shadow of the Tomb Raider TAA 111 / 162 65 / 84 89 / 117 107 / 140 114 / 149 84 / 115 89 / 114
Strange Brigade AA Ultra 264 / 346 106 / 137 136 / 178 176 / 228 201 / 261 123 / 186 119 / 168
Total War: THREE KINGDOMS TAA 86 / 102 38 / 46 47 / 57 60 / 71 69 / 83 44 / 52 39 / 47
Макс. −28% −21% −10% −5% −13% −15%
Средн. −52% −40% −27% −19% −39% −41%
Мин. −63% −51% −36% −26% −49% −54%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)
Assassin’s Creed Odyssey TAA High 77 / 92 44 / 49 56 / 62 54 / 64 65 / 75 43 / 53 47 / 56
Battlefield V TAA High 143 / 160 80 / 99 98 / 115 113 / 130 126 / 145 111 / 129 100 / 124
Borderlands 3 TAA 92 / 105 37 / 42 50 / 57 58 / 65 67 / 76 57 / 62 57 / 62
Control TAA 99 / 103 36 / 39 51 / 55 64 / 71 70 / 79 60 / 64 51 / 57
DOOM Eternal TAA 168 / 251 59 / 92 74 / 123 116 / 175 128 / 187 90 / 138 90 / 135
Metro Exodus TAA 49 / 81 21 / 36 27 / 47 33 / 56 39 / 64 27 / 45 26 / 44
Red Dead Redemption 2 TAA High 68 / 74 24 / 27 33 / 35 43 / 47 49 / 53 35 / 38 34 / 36
Shadow of the Tomb Raider TAA 110 / 139 44 / 55 62 / 78 77 / 96 84 / 107 61 / 81 61 / 76
Strange Brigade AA Ultra 210 / 262 77 / 94 102 / 127 135 / 164 153 / 189 99 / 138 93 / 121
Total War: THREE KINGDOMS TAA 60 / 70 25 / 29 32 / 38 40 / 47 47 / 55 30 / 34 26 / 31
Макс. −38% −28% −19% −9% −19% −23%
Средн. −57% −44% −32% −23% −42% −45%
Мин. −64% −53% −38% −28% −51% −56%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт) NVIDIA GeForce GTX 1080 (1607/1733 МГц, 10 Гбит/с, 8 Гбайт) NVIDIA GeForce GTX 1080 Ti (1480/1582 МГц, 11 Гбит/с, 11 Гбайт) NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт) NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт) AMD Radeon VII (1400/1750 МГц, 2 Гбит/с, 16 Гбайт) AMD Radeon RX 5700 XT (1605/1905 МГц, 14 Гбит/с, 8 Гбайт)
Assassin’s Creed Odyssey TAA High 58 / 65 26 / 30 36 / 40 40 / 46 39 / 46 35 / 41 33 / 37
Battlefield V TAA High 100 / 114 44 / 55 55 / 68 67 / 80 75 / 90 64 / 76 55 / 68
Borderlands 3 TAA 53 / 60 20 / 22 27 / 31 32 / 35 37 / 41 29 / 32 29 / 34
Control TAA 53 / 55 17 / 19 25 / 27 32 / 36 36 / 41 31 / 33 25 / 28
DOOM Eternal TAA 118 / 159 38 / 52 49 / 69 73 / 98 83 / 108 62 / 85 47 / 62
Metro Exodus TAA 36 / 55 14 / 23 20 / 31 24 / 37 28 / 43 20 / 31 19 / 29
Red Dead Redemption 2 TAA High 51 / 54 18 / 19 24 / 25 31 / 34 36 / 39 26 / 28 24 / 26
Shadow of the Tomb Raider TAA 66 / 79 23 / 28 33 / 41 42 / 51 48 / 58 34 / 44 30 / 39
Strange Brigade AA Ultra 134 / 155 44 / 52 60 / 71 83 / 93 95 / 109 70 / 88 61 / 72
Total War: THREE KINGDOMS TAA 33 / 38 13 / 15 16 / 19 21 / 24 25 / 29 15 / 18 12 / 15
Макс. −52% −38% −29% −21% −33% −40%
Средн. −62% −48% −36% −27% −44% −50%
Мин. −67% −57% −42% −32% −53% −61%

⇡ #Результаты игровых тестов с трассировкой лучей

1920 × 1080
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.
Battlefield V TAA High 95 / 117 67 / 87 77 / 97
Control TAA 85 / 91 54 / 58 66 / 70
Metro Exodus TAA 47 / 75 34 / 54 39 / 63
Minecraft with RTX Beta Нет 103 / 115 61 / 70 69 / 79
Quake II RTX TAA Н/Д / 119 Н/Д / 72 Н/Д / 88
Shadow of the Tomb Raider TAA 90 / 121 62 / 89 73 / 102
Макс. −26% −16%
Средн. −32% −22%
Мин. −39% −31%
2560 × 1440
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.
Battlefield V TAA High 72 / 95 49 / 66 56 / 75
Control TAA 59 / 64 36 / 38 43 / 46
Metro Exodus TAA 38 / 57 26 / 39 30 / 46
Minecraft with RTX Beta Нет 66 / 72 37 / 42 43 / 49
Quake II RTX TAA Н/Д / 71 Н/Д / 42 Н/Д / 51
Shadow of the Tomb Raider TAA 67 / 90 42 / 60 49 / 69
Макс. −31% −19%
Средн. −36% −25%
Мин. −42% −32%
3840 × 2160
Полноэкранное сглаживание Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT вкл. NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT вкл.
Battlefield V TAA High 43 / 61 27 / 39 32 / 45
Control TAA 31 / 34 18 / 20 22 / 24
Metro Exodus TAA 23 / 34 14 / 21 17 / 26
Minecraft with RTX Beta Нет 30 / 34 17 / 18 21 / 23
Quake II RTX TAA Н/Д / 33 Н/Д / 19 Н/Д / 23
Shadow of the Tomb Raider TAA 38 / 50 21 / 30 26 / 37
Макс. −36% −24%
Средн. −41% −28%
Мин. −47% −32%
3840 × 2160
Полноэкранное сглаживание (без DLSS) Palit GeForce RTX 3080 GamingPro OC (1440/1740 МГц, 19 Гбит/с, 10 Гбайт), RT + DLSS NVIDIA GeForce RTX 2080 SUPER (1650/1815 МГц, 15,5 Гбит/с, 8 Гбайт), RT + DLSS NVIDIA GeForce RTX 2080 Ti FE (1350/1645 МГц, 14 Гбит/с, 11 Гбайт), RT + DLSS
Battlefield V TAA High 59 / 72 41 / 51 46 / 58
Control TAA 53 / 56 33 / 35 39 / 41
Metro Exodus TAA 34 / 48 23 / 33 28 / 40
Minecraft with RTX Beta Нет 87 / 95 49 / 56 57 / 65
Shadow of the Tomb Raider TAA 55 / 69 36 / 47 42 / 55
Макс. −29% −17%
Средн. −34% −23%
Мин. −41% −32%

⇡ #Выводы

В ближайшее время GeForce RTX 3080 предстоит выдержать сравнение не только с ускорителями NVIDIA прошлого поколения, но и с грядущими высокопроизводительными продуктами AMD. Однако неважно, чем закончится это противостояние, уже сейчас очевидно, что 30-я серия GeForce на чипах Ampere скорее вызовет согласие во мнениях, нежели ожесточенные споры, которые спровоцировала линейка RTX 20.

Теперь, когда все трудности с доставкой тестовых образцов остались позади и можно оперировать данным независимых измерений производительности, болельщикам зеленой команды, которые без колебаний поверили в заявления о двукратном превосходстве новинки над RTX 2080, и скептикам, твердившим о «фальшивых шейдерах» придется выработать компромиссный взгляд на быстродействие RTX 3080. Конечно, NVIDIA подобрала для рекламных материалов тесты, представляющие новое поколение в самом выгодном свете, а на практике среднее преимущество RTX 3080 перед GeForce RTX 2080 SUPER оценивается более скромными 55 % FPS, если взять игры в режиме 4К без трассировки лучей, и 52–69 % с трассировкой (в зависимости от того, используется ли DLSS). Можно возразить, что мы взяли GeForce RTX 2080 SUPER, а не оригинальный RTX 2080, отталкиваться от которого, разумеется, удобнее NVIDIA, но разница в быстродействии между последними не превышает 5 % и, следовательно, не меняет общую картину.

Как ни крути, в реальных играх RTX 3080 не настолько силен, как на бумаге, но повода для расстройства или злорадства мы в этом тоже не нашли. После серии чипов Turing — революционной в функциональном плане, но разочаровывающей с точки зрения прироста быстродействия — хочется вернуть назад цифры межпоколенческой разницы свыше 70 % FPS, но стоит напомнить, что Pascal был уникальным явлением, которое стало возможным благодаря рывку фотолитографии с норм 28 на 16 нм. Не факт, что технологии производства чипов в современном виде когда-либо позволяет его повторить. Ampere усилил видеокарты NVIDIA больше, чем весьма успешная для своего времени архитектура Maxwell, а в тестах с трассировкой лучей и вправду можно отыскать результаты, близкие к достижениям Pascal.

Но главное в Ampere — это не столько количественный, сколько качественный характер, который приобретает рост производительности. GeForce RTX 3080 по силам любые игры (кроме самых сложных или скверно оптимизированных) в 4К на максималках, а при разрешении 1440p он в большинстве случаев не нуждается в DLSS даже для трассировки лучей. Впрочем, рейтрейсинг по-прежнему так сильно нагружает GPU, что без технологий масштабирования кадров резерва для будущих, еще более требовательных игр, осталось немного даже у RTX 3080 (благо сама DLSS с каждой итерацией работает все лучше и стремиться отбросить ее любой ценой бессмысленно). Как бы то ни было, теперь можно поставить точку в затянувшейся истории GeForce GTX 1080 Ti — владельцы этого ускорителя могут смело рассчитывать на двойную норму прежнего фреймрейта. Единственное противопоказание к апгрейду на RTX 3080 — если вы сидите за монитором с разрешением 1920 × 1080. Даже самый современный CPU не выжмет из старших Ampere быстродействия, на которое они рассчитаны, в таком графическом режиме.

Пожалуй, единственная претензия, которую мы можем предъявить к GeForce RTX 3080 с чисто технической стороны — это энергопотребление, которое действительно доходит до честно указанных 320 Вт. Впору воскресить старинный мем «GTX — ПЕЧ», если бы не смена буквы в названии видеокарт. Впрочем, мы и в данном вопросе придерживаемся скорее позитивной, нежели негативной точки зрения. Palit — пожалуй, самый доступный бренд графических ускорителей в России, но плата RTX 3080 GamingPro OC, благодаря которой мы познакомились с Ampere, не испытывает ни малейших проблем c охлаждением и тишиной. А сам по себерасход электроэнергии пользователей хорошо вентилируемых (для RTX 3080 вообще и видеокарты Palit в особенности это принципиальное условие) настольных ПК волновать не должен. Только на разгон GeForce RTX 3080 лучше не рассчитывать — NVIDIA уже сделала это заранее.

Что вызывает настоящие опасения, так это доступность «зеленых» новинок в рознице и, как следствие, их реальные, а не паспортные цены. В прошлые годы мы еще не сталкивались с тем, что свежих видеокарт попросту нигде нет в продаже, хотя у партнеров чипмейкера была масса времени, чтобы наладить выпуск собственных устройств. А Founders Edition недоступен в российском интернет-магазине NVIDIA даже по предзаказу. Кроме того, мы уже писали в первой части обзора потребительских Ampere, что эти ускорители в принципе не созданы дешевыми. Приготовьтесь к тому, что видеокарты из первых поставок GeForce RTX 3080 будут стоит намного больше соблазнительных рекомендованных значений. А лучше повремените с апгрейдом еще месяц-два. Тогда и дефицит пойдет на убыль, и станет ясно, чем ответит на дебют 30-й серии красный конкурент.

If you notice an error, select it with the mouse and press CTRL + ENTER.

Leave a Comment