from Zen through Zen + and Zen 2 to Zen 3 / Processors and memory

from Zen through Zen + and Zen 2 to Zen 3 / Processors and memory


AMD approached 2017 with a very sad processor baggage. Members of the Bulldozer family, which were not very successful from the very beginning, by this point had lost all ability to compete with Intel’s alternatives. AMD could only count on the attention from the most unassuming users in the lower price segment, while any attempt to offer something to enthusiasts turned into a rather pathetic sight. What, for example, is the release of Centurion processors (FX-9370 and FX-9590), which at a frequency of under 5 GHz and a nominal heat dissipation of 220 W demonstrated performance only at the level of Core i5 of the then generation of Haswell. In other words, AMD’s position in the processor market was extremely deplorable.

But although at that time many believed that AMD’s processor business could no longer be saved, in fact, hard work was in full swing in the depths of the company. Back in 2012, then AMD CEO Rory Read made a very far-sighted step – convinced Jim Keller to return to the development department, who once already played a key role in the company’s fate, giving life to the legendary Athlon 64 and Opteron processors. And Keller did not disappoint this time either. He was able to unite the best engineering talent around him and over the years created a solid basis for a new wave of growth in AMD’s processor direction – the Zen microarchitecture.

Since 2017, when the first processors based on this microarchitecture came to the market, a completely new stage has begun in AMD’s life. Zen-based mass processors are called Ryzen, which is consonant with the English verb to rise, and the equally symbolic logo in the form of the Buddhist calligraphic symbol “Enso”, expressing perfect enlightenment, and such hints do not seem overly pretentious. Ryzen actually performed a complete reboot of AMD, and thanks to this, they dramatically changed the trajectory of the future development of the company.

Keller’s contribution was not only technical – the famous engineer was able to prove himself an excellent mentor and helped to reveal the talents of other AMD employees, who continued to improve Zen after he left in 2016. So, now the development of the latest versions of Zen is led by Mike Clark – one of the rank and file members of the original “Keller team”. And I must say, he is good at it. At least the situation on the processor market over the past couple of years has changed to the exact opposite: thanks to the current iterations of the Zen microarchitecture, AMD has convincingly seized the lead in processor performance.

In the Zen microarchitecture, the developers have completely erased the entire legacy of Bulldozer – without this, no progress would be possible. The fact is that Bulldozer turned out to be unsuccessful already at the conceptual level: the “building” processor design involved combining a large number of simple computing cores in the CPU, which turned out to be poorly suited for software that existed in 2010s. That is why Zen has undergone a paradigm shift towards traditional “big cores”, ideologically more similar to Athlon and Phenom cores.

At Bulldozer, AMD took a modular approach called Clustered Multithreading (CMT). Its essence consisted in the joint use of a significant part of the processor functional blocks by pairs of cores. In particular, a floating point computation unit, a cache memory, and the entire input part of the execution pipeline – a unit for fetching and decoding instructions – were divided between the cores. Zen, on the contrary, consists of completely independent cores, and moreover, this microarchitecture for the first time in AMD practice has support for SMT (Simultaneous Multithreading) technology, similar to Intel Hyper-Threading. In fact, Zen kernels can be characterized as “wide” – they are aimed at executing as many x86 instructions at the same time. But you shouldn’t think that AMD decided to repeat all the basic ideas of processor building after Intel, which came to “wide” cores much earlier. For example, Zen does not yet have additional highly specialized AI “accelerators” like AVX-512 and Deep Learning Boost, which Intel has been promoting recently, but there is something else – pronounced modularity.

The fact that in processors based on the Zen microarchitecture the stake will be placed on a multi-chip arrangement of processors was clear from the very beginning. This approach has been used since the very first Zen, but at first it was only used in server and HEDT products. But with subsequent iterations of the microarchitecture, a similar structure found its place in ordinary Ryzen. Intel, on the other hand, initially criticized “chiplets”, although later came to the same ideas with layout solutions EMIB (Embedded Multi-die Interconnect Bridge) and Foveros (multi-level chip connections), although they are not yet used in mainstream CPUs.

Now, after four years have passed since the release of the first Zen, it is clearly visible: everything that was originally laid down in this microarchitecture, one way or another, has borne fruit. Through multiple stages of advancement, AMD processors have ultimately become the most advanced and highest performing solutions on the market. We were impressed by such progress – and we decided to retrace the path that AMD has taken to its current success. In this article, we invite you to get acquainted with the results of “thematic” testing, which compares four successive generations of Ryzen processors – from those based on the very first version of the Zen architecture to modern carriers of the Zen 3 microarchitecture. However, before comparing the results of performance tests, let’s dive a little deeper into memories.

⇡ # How it all began – Zen and Zen +

The first generation Zen was designed from scratch – in these processors, AMD dropped all previous developments. And it immediately became clear that this was absolutely the right decision. Long before the release of real processors, when the company first introduced the Zen microarchitecture in 2015, it did not hesitate to promise a huge leap in specific performance, and even then there was a feeling that a revolution was coming. Still, after all, the transition from Excavator (the last iteration of Bulldozer), according to the company’s calculations, should have increased the IPC indicator (the number of instructions executed per clock cycle) by a seemingly incredible 40% at that time.

And all this turned out to be not empty words: in mid-2016, AMD confirmed an incredible leap in performance with a practical demonstration: the company showed that in rendering tasks its future chip is able to compete with the current eight-core HEDT processor of the competitor Core i7-6900K (eight-core Broadwell-E) … At the same time, AMD outlined its plans for the future platform and confirmed that mass processors will continue to use the Socket AM4 socket and DDR4 memory, like the previously presented APUs of the Bristol Ridge family.

Finally, in March 2017, the first Ryzen thousandth series were introduced – the initial lineup immediately included processors with up to eight cores, despite the fact that the competitor in the mainstream segment at that time had only quad-core processors. And the new items met expectations – the flagship Ryzen 7 1800X really demonstrated performance at the level of the Core i7-6900K, albeit only in resource-intensive applications. With gaming performance, the situation with AMD processors was much worse – here it was impossible to talk about any competition with Intel’s proposals. But be that as it may, against the background of Bulldozer, the new processors looked very encouraging. In fact, the Ryzen 7 1800X turned out to be about twice as good as the FX-8370, and that was enough to make it clear that AMD is returning to the big game.

Let’s remember what the first generation Ryzen was like. Each processor with the Zen microarchitecture, despite the monolithic single-chip design, consisted of a pair of CCX (Core Complex) modules connected by the Infinity Fabric bus, each of which contained four computing cores and 8 MB of L3 cache. Common to the two CCXs were I / O units with PCI Express 3.0, SATA, USB controllers, and so on, as well as a dual-channel memory controller.

Each processor core had a decoder with a performance of 4 micro-instructions per clock and a decoded micro-op cache for 2 thousand instructions, which, in terms of its meaning, was the same as a similar block of Intel processors. The execution domain of the kernel contained four arithmetic logic units (ALU), two address generation units (AGU) and four 128-bit floating point units (FPU).

AMD used the same eight-core Zen semiconductor crystals to build not only Ryzen desktop processors, but also EPYC 7001 server processors (codenamed Naples). In them, through the Infinity Fabric bus, four crystals were combined, which made it possible to obtain processors with up to 32 cores and an eight-channel memory controller. And it became a great engineering idea – thanks to this unification, AMD was able to get super-powerful server offerings in one fell swoop that outperformed Intel processors of the same class in all basic characteristics: in the number of cores, in terms of memory bandwidth and in the number of PCI Express lanes. And what’s more, to deal another blow to the processor market, AMD also released the Threadripper HEDT processors, composed of two Zen semiconductor chips, which were able to offer up to 16 cores and support for four-channel DDR4 SDRAM.

About a year and a half after the appearance of the first generation Ryzen processors, AMD prepared their update – the Ryzen 2000 series. However, this was not a very significant step along the path of progress – in fact, it was just a new stepping of the original design. The most important change was the change in the used process technology – instead of 14LPP (14nm Low Power Plus), the new generation Ryzen switched to 12LP (12nm Leading Performance) technology, which made it possible to somewhat increase clock frequencies and optimize latencies. But as for the microarchitecture itself, it has undergone minimal changes, and therefore it was given the “intermediate” name Zen +.

However, the senior representative of the updated family, Ryzen 7 2700X, turned out to be faster than its predecessor, and AMD processors continued to confidently dominate in terms of performance in computing tasks, despite the appearance of competing six-cores like the Core i7-8700K from Intel. However, there has been no talk of a fundamental improvement in the situation with performance in games. The Ryzen 7 2700X began to look a little more confident than the Ryzen 7 1800X in gaming, but nevertheless it still fundamentally lost to the competitor’s processors.

But with the advent of Zen + cores, AMD has also updated the Threadripper series – it has processors with up to 32 cores, already composed of four semiconductor crystals. And although they did not find wide support from enthusiasts due to their peculiar NUMA topology, this was another important step for AMD in achieving new heights of computing performance.

However, the fun began later, in 2019, when AMD took the next step and migrated its processors to the Zen 2 microarchitecture and groundbreaking chiplet design.

⇡ # Second dash – Zen 2 and Zen 3

For the next series of processors, Ryzen 3000, AMD has redefined its packaging approaches and decided to rely on multichip assemblies, including in processors for the desktop segment. In the Zen 2 microarchitecture, the processor cores were physically separated from the memory controller and I / O circuits, as a result of which two types of dissimilar semiconductor crystals – chiplets – were simultaneously used in each processor. Firstly, these were I / O chiplets produced according to the 12LP process technology, which housed a DDR4 SDRAM controller, a PCI Express 4.0 controller, as well as SATA and USB controllers. Secondly, chiplets with eight processor cores, for the production of which the thinner N7 process technology (7 nm) was used. Among other things, this division allowed AMD, in addition to the usual Ryzen, to create a new subclass of mass processors – 12- and 16-core Ryzen 9, which used a pair of processor chiplets at once.

However, the increase in the number of cores was not the main advantage of Zen 2 and processors based on this microarchitecture. Other significant improvements have found their place in them. For example, the transition to a more modern production technology made it possible to double the size of the L3 cache – now there is 16 MB of cache for each four-core CCX module. Also, the microarchitecture has been significantly reworked at a low level.

In the transition prediction scheme, in addition to the perceptron, the multistep statistical mechanism TAGE (Tagged geometric) was implemented. The L1 instruction cache was cut in half, but the depth of the micro-ops cache was doubled. In the executive domain, a third address unit (AGU) was added, and all real-valued devices (FPU) were doubled in width – up to 256 bits. As a result, Zen 2 was able to process AVX2 instructions in one pass, without splitting them into two parts, as was the case in Zen and Zen +. And this change, perhaps, should be considered the most important, at least from the point of view of servers and workstations – there, fast processing of vector instructions is very important.

As a result of all the optimizations and improvements, the Ryzen 3000 processors have noticeably tightened up in performance, and while they still lagged behind competing Intel offerings under gaming load, the gap was not so glaring. But in computing tasks, AMD’s advantage became undeniable: eight-cores like the Ryzen 7 3800X turned out to be faster than the Intel Core i9-9900K with the same number of cores that appeared a little earlier with the same number of cores in almost any application for creating and processing content, not to mention the fact that the multi-core Ryzen 9 models they simply had no competitors.

The Zen 2 chiplet design has allowed AMD to build on its success in the HEDT segment as well. The updated Threadripper got rid of the NUMA topology inconvenient for workstations and increased the number of cores to 64 pieces. Along the way, noticeable progress has occurred in the company’s server series of processors, due to which AMD was able to greatly increase sales of the EPYC 7002 (codenamed Rome).

Meanwhile, Zen 2 is far from the final point in the evolution of microarchitecture. The development of new processor designs at AMD, as in many other companies, is carried out by two teams that implement their projects one by one. And therefore, after Zen 2, which brought with it a large baggage of innovations, Zen 3 appeared, in which the scale of improvements was by no means smaller, but at the same time affecting other aspects of the microarchitecture. AMD itself claimed that the increase in IPC when moving from Zen 2 to Zen 3 was 19%, and in games it is even higher and reaches 23%.

All changes in Zen 3 relate exclusively to chiplets with processor cores – the I / O chiplets in the Ryzen 5000 series based on the Zen 3 microarchitecture are inherited from the Ryzen 3000. The main improvement concerns their internal structure: in Zen 3, CCX modules are paired, that is, a processor chiplet Finally, it has become a unified design from a logical point of view, combining eight equal cores and a shared 32 MB L3 cache memory between them. This immediately reduced the latencies when working with cores with shared data – now the cores located in the same chiplet were able to interact with each other through a much closer cache memory, and not through the Infinity Fabric bus external to CCX modules.

However, the matter is not limited to only one reorganization of CCX. Inside the Zen 3 kernels, a lot of microarchitectural optimizations were carried out both in the input part of the computational pipeline, and in the executive domain and in the data processing subsystem. The main changes include the rearrangement of ALU and AGU devices with the allocation of a separate device for processing branches, the addition of two additional FPU devices, as well as more flexible work with the L1D cache in terms of the ability to perform more simultaneous loads and saves. At the same time, branch prediction algorithms have once again improved, and the sizes of many internal buffers have been rebalanced.

As a result, processors such as the Ryzen 7 5800X have finally challenged the legitimacy of Intel Core as the best choice for gaming systems. And along with the entrenched advantage in computing performance, they have earned the right to be considered the fastest consumer CPUs of today, at least until Intel responds to Zen 3 with an update of its own microarchitecture.

⇡ # A little about perspectives – Zen 3+ and Zen 4

Back in March last year, AMD announced that the Zen 3 microarchitecture would be followed by the Zen 4 microarchitecture, but this statement was made in relation to the server segment. At the time of this posting, Zen 3-based EPYC 7003 (codenamed Milan) processors have not yet been officially announced, although this should happen very soon. This means that the introduction of new generations of AMD architectures in the server market is somewhat late, but at the same time, EPYC 7004 processors (codenamed Genoa) based on the Zen 4 design are promised already in 2022.

As such, you can expect AMD’s pace of generational change in the Ryzen world to continue unabated. И знать об этом очень приятно, потому как вместе с внедрением микроархитектуры Zen 4 в платформе AMD ожидается сразу несколько важных изменений: переход на 5-нм техпроцесс со всеми сопутствующими дивидендами и поддержка более быстрой памяти стандарта DDR5.

Из неофициальных планов AMD, которые временами просачиваются в прессу, известно, что перед выходом десктопных воплощений Zen 4 с кодовым именем Raphael на рынок должно прийти ещё одно поколение Ryzen, фигурирующее под кодовым именем Warhol. Предполагается, что такие процессоры сохранят микроархитектуру Zen 3 и станут чем-то вроде слегка разогнанных Ryzen 5000, но есть и другая гипотеза. Вполне может статься, что в Warhol компания AMD заменит чиплет ввода-вывода, осуществив переход на Socket AM5 и внедрив поддержку DDR5 в десктопном сегменте, не дожидаясь миграции на ядра Zen 4. AMD всегда говорила, что процессорное гнездо Socket AM4 останется актуальным только до 2020 года, и поэтому, если чипы Warhol под новый процессорный разъем появятся в этом году, это вполне впишется в общую канву публичных планов компании.

The lineup Техпроцесс Микроархитектура Platform Срок выхода
Summit Ridge Ryzen 1000 14LPP Zen AM4 2017
Pinnacle Ridge Ryzen 2000 12LP Zen+ AM4 2018
Matisse Ryzen 3000 N7 + 12LP Zen 2 AM4 2019
Matisse Refresh Ryzen 3000XT N7 + 12LP Zen 2 AM4 2020
Vermeer Ryzen 5000 N7 + 12LP Zen 3 AM4 2020
Warhol ? N7 + ? Zen 3(+) ? 2021
Raphael ? ? Zen 4 AM5 2022

На данный момент никакие конкретные детали про Zen 4 достоверно не известны. В нескольких интервью высокопоставленные сотрудники AMD лишь упоминали, что список изменений, запланированных в Zen 4, не меньше соответствующего списка для Zen 3. И что оптимизация дизайна ведётся по нескольким направлениям, включая кеш-память, схему предсказания переходов и исполнительный домен. Кроме того, уместно будет вспомнить о том, что 5-нм техпроцесс TSMC, которым собирается воспользоваться AMD, обеспечивает 84-процентное увеличение плотности транзисторов на кристалле в сравнении с технологией N7 и может дать либо 30-процентное снижение энергопотребления, либо 15-процентный рост частоты. Как AMD распорядится этими преимуществами — не известно. Но ходят слухи, что по крайней мере серверные процессоры на базе Zen 4 получат большее число вычислительных ядер, а также обретут поддержку дополнительных наборов векторных инструкций.

Впрочем, нужно оговориться, что бушующий в 2021 году глобальный дефицит полупроводников способен привести к срыву любых процессорных планов, особенно если речь идёт о планах компании AMD, которая не располагает собственными производственными мощностями.

⇡#Характеристики Ryzen разных поколений в сравнении

Чтобы сопоставить четыре варианта Ryzen, основанных на микроархитектурах c Zen по Zen 3, мы взяли флагманские восьмиядерные процессоры, относящиеся к серии Ryzen 7. Такой выбор обусловлен отсутствием в семействах Ryzen 1000 и Ryzen 2000 процессоров с большим числом ядер – 12- и 16-ядерные CPU компания AMD стала выпускать лишь с серии Ryzen 3000.

Паспортные характеристики процессоров, попавших в это сравнение, представлены в таблице.

Ryzen 7 1800X Ryzen 7 2700X Ryzen 7 3800XT Ryzen 7 5800X
Platform AM4 AM4 AM4 AM4
Кодовое имя Summit Ridge (Zen) Pinnacle Ridge (Zen+) Matisse (Zen 2) Vermeer (Zen 3)
Техпроцесс 14LPP (GloFo) 12LP (GloFo) N7 (TSMC) + 12LP (GloFo) N7 (TSMC) + 12LP (GloFo)
Площадь ядра, мм2 213 (SoC) 213 (SoC) 74 (CCD) + 125 (IOD) 81 (CCD) + 125 (IOD)
Число транзисторов, млрд 4,8 (SoC) 4,8 (SoC) 3,9 (CCD) + 2,09 (IOD) 4,15 (CCD) + 2,09 (IOD)
Ядра/потоки 8/16 8/16 8/16 8/16
Тактовая частота, ГГц 3,6-4,1 3,7-4,35 3,9-4,7 3,8-4,7
L3-кеш, Мбайт 8+8 8+8 16+16 32
Память DDR4-2666 DDR4-2933 DDR4-3200 DDR4-3200
PCI Express 24 × Gen3 24 × Gen3 24 × Gen4 24 × Gen4
TDP, Вт 95 105 105 105
PPT, Вт 142 142 142 142
Price $499 $329 $399 $449

⇡#Описание тестовой системы и методики тестирования

Основные герои настоящего тестирования – восьмиядерники AMD четырёх последовательных поколений: Ryzen 7 1800X, Ryzen 7 2700X, Ryzen 7 3800XT и Ryzen 7 5800X. Их практическое сравнение должно нам позволить сделать выводы о том, как AMD добилась успеха в столь сжатые сроки и какой по величине прирост производительности обеспечивает каждое из поколений процессоров Ryzen.

Однако мы не ограничились тестированием одних лишь процессоров AMD. Компанию им составил также и Core i7-10700K – современный восьмиядерный процессор Intel, построенный на микроархитектуре Skylake (она используется компанией в настольных процессорах с 2015 года). Его участие в сравнении позволит выяснить, в какой конкретно момент AMD смогла превзойти по быстродействию своего конкурента и какой разрыв между процессорами разных производителей существует сейчас.

Таким образом, в состав тестовой системы вошли следующие комплектующие:

  • Процессоры:
    • AMD Ryzen 7 5800X (Vermeer, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
    • AMD Ryzen 7 3800XT (Matisse, 8 ядер + SMT, 3,8-4,7 ГГц, 32 Мбайт L3);
    • AMD Ryzen 7 2700X (Pinnacle Ridge, 8 ядер + SMT, 3,7-4,35 ГГц, 16 Мбайт L3);
    • AMD Ryzen 7 1800X (Summit Ridge, 8 ядер + SMT, 3,6-4,1 ГГц, 16 Мбайт L3);
    • Intel Core i7-10700K (Comet Lake, 8 ядер + HT, 3,8-5,1 ГГц, 16 Мбайт L3).
  • Процессорный кулер: кастомная СЖО EKWB.
  • Материнские платы:
    • ASRock X470 Taichi Ultimate (Socket AM4, AMD X470);
    • ASUS ROG Crosshair VIII Hero (Socket AM4, AMD X570);
    • ASUS ROG Maximus XII Hero (Wi-Fi) (LGA 1200, Intel Z490).
  • Память: 2 × 16 Гбайт DDR4-3600 SDRAM, 16-18-18-38 (Crucial Ballistix RGB BL2K16G36C16U4BL).
  • Видеокарта: NVIDIA GeForce RTX 3090 Founders Edition (GA102, 1395-1695/19500 МГц, 24 Гбайт GDDR6X 384-бит).
  • Дисковая подсистема: Intel SSD 760p 2 Тбайт (SSDPEKKW020T8X1).
  • Блок питания: Thermaltake Toughpower DPS G RGB 1000W Titanium (80 Plus Titanium, 1000 Вт).

Наличие в списке комплектующих материнской платы, основанной на наборе логики AMD X470, обусловлено отсутствием сквозной совместимости между платами и процессорами внутри экосистемы Socket AM4. Процессоры Ryzen первого поколения не могут работать в современных платах, поэтому для тестов Ryzen 7 1800X пришлось использовать старую материнскую плату ASRock X470 Taichi Ultimate.

Все сравниваемые процессоры тестировались с настройками, принятыми производителями плат по умолчанию. Это значит, что для платформ Intel обозначенные в спецификациях ограничения по энергопотреблению игнорируются, вместо чего используются предельно возможные частоты в целях получения максимальной производительности. В таком режиме эксплуатирует процессоры подавляющее большинство пользователей, поскольку включение лимитов по тепловыделению и энергопотреблению в большинстве случаев требует специальной настройки параметров BIOS.

Все сравниваемые процессоры были протестированы с памятью, работающей в режиме DDR4-3600 с настройками таймингов по XMP, за исключением AMD Ryzen 7 1800X. Поскольку данный процессор не обеспечивал стабильной работоспособности со скоростной памятью, для него частота памяти понижалась до состояния DDR4-3200 со схемой задержек 16-18-18-38.

Тестирование выполнялось в операционной системе Microsoft Windows 10 Pro (20H2) Build 19042.572 с использованием следующего комплекта драйверов:

  • AMD Chipset Driver 2.13.27.501;
  • Intel Chipset Driver 10.1.31.2;
  • NVIDIA GeForce 461.40 Driver.

Описание использовавшихся для измерения вычислительной производительности инструментов:

Комплексные бенчмарки:

  • Futuremark PCMark 10 Professional Edition 2.1.2508 – тестирование в сценариях Essentials (обычная работа среднестатистического пользователя: запуск приложений, сёрфинг в интернете, видеоконференции), Productivity (офисная работа с текстовым редактором и электронными таблицами), Digital Content Creation (создание цифрового контента: редактирование фотографий, нелинейный видеомонтаж, рендеринг и визуализация 3D-моделей).
  • 3DMark Professional Edition 2.17.7173 — тестирование в сцене Time Spy Extreme 1.0.

Приложения:

  • 7-zip 19.00 — тестирование скорости архивации. Измеряется время, затрачиваемое архиватором на сжатие директории с различными файлами общим объёмом 3,1 Гбайт. Используется алгоритм LZMA2 и максимальная степень компрессии.
  • Adobe Photoshop 2021 22.2.0 — тестирование производительности при обработке графических изображений. Измеряется среднее время выполнения тестового скрипта Puget Systems Adobe Photoshop CC Benchmark 18.10, моделирующего типичную обработку изображения, сделанного цифровой камерой.
  • Adobe Photoshop Lightroom Classic 10.11 – тестирование производительности при пакетной обработке серии изображений в RAW-формате. Тестовый сценарий включает постобработку и экспорт в JPEG с разрешением 1920 × 1080 и максимальным качеством двухсот 16-мегапиксельных изображений в RAW-формате, сделанных цифровой камерой Fujifilm X-T1.
  • Adobe Premiere Pro 2020 14.9.0 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат YouTube 4K проекта, содержащего HDV 2160p30 видеоряд с наложением различных эффектов.
  • Blender 2.91.2 – тестирование скорости финального рендеринга в одном из популярных свободных пакетов для создания трёхмерной графики. Измеряется продолжительность построения финальной модели pavillon_barcelona_v1.2 из Blender Benchmark.
  • Cinebench R23 – стандартный бенчмарк для тестирования скорости рендеринга в Cinema 4D R23.
  • Magix Vegas Pro 18.0 — тестирование производительности при нелинейном видеомонтаже. Измеряется время рендеринга в формат YouTube 4K проекта, содержащего HDV 2160p30 видеоряд с наложением различных эффектов.
  • Microsoft Visual Studio 2017 (15.9.33) – измерение времени компиляции крупного MSVC-проекта – профессионального пакета для создания трёхмерной графики Blender версии 2.79b.
  • Stockfish 12 – тестирование скорости работы популярного шахматного движка. Измеряется скорость перебора вариантов в позиции «1q6/1r2k1p1/4pp1p/1P1b1P2/3Q4/7P/4B1P1/2R3K1 w».
  • SVT-AV1 v0.8.5 — тестирование скорости транскодирования видео в перспективный формат AV1. Для оценки производительности используется исходный 1080p@50FPS AVC-видеофайл, имеющий битрейт около 30 Мбит/с.
  • Topaz Video Enhance AI v1.7.1 – тестирование производительности в основанной на ИИ программе для улучшения детализации видео. В тесте используется исходное видео в разрешении 640 × 360, которое увеличивается в два раза с использованием модели Artemis LQ v7.
  • V-Ray 5.00 – тестирование производительности работы популярной системы рендеринга при помощи стандартного приложения V-Ray Benchmark Next.
  • VeraCrypt 1.24 – тестирование криптографической производительности. Используется встроенный в программу бенчмарк, задействующий тройное шифрование Kuznyechik-Serpent-Camellia.
  • x265 3.4+26 10bpp — тестирование скорости транскодирования видео в формат H.265/HEVC. Для оценки производительности используется исходный 2160p@24FPS AVC-видеофайл, имеющий битрейт около 42 Мбит/с.

Игры:

  • Assassin’s Creed Odyssey. Разрешение 1920 × 1080: Graphics Quality = Ultra High. Разрешение 3840 × 2160: Graphics Quality = Ultra High.
  • Borderlands 3. Разрешение 1920 × 1080: Graphics API = DirectX 12, Overall Quality = Badass. Разрешение 3840 × 2160: Graphics API = DirectX 12, Overall Quality = Badass.
  • Civilization VI: Gathering Storm. Разрешение 1920 × 1080: DirectX 12, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra. Разрешение 3840 × 2160: DirectX 12, MSAA = 4x, Performance Impact = Ultra, Memory Impact = Ultra.
  • Crysis Remastered. Разрешение 1920 × 1080: Graphics Settings = Very High, RayTracing Quality = Very High, Anti-Aliasing = TSAA. Разрешение 3840 × 2160: Graphics Settings = Very High, RayTracing Quality = Very High, Anti-Aliasing = TSAA.
  • Cyberpunk 2077. Разрешение 1920 × 1080: Quick Preset = Ray Tracing – Ultra. Разрешение 3840 × 2160: Quick Preset = Ray Tracing – Ultra.
  • Far Cry New Dawn. Разрешение 1920 × 1080: Graphics Quality = Ultra, HD Textures = On, Anti-Aliasing = TAA, Motion Blur = On. Разрешение 3840 × 2160: Graphics Quality = Ultra, Anti-Aliasing = Off, Motion Blur = On.
  • Hitman 3. Разрешение 1920 × 1080: Super Sampling = 1.0, Level of Detail = Ultra, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = Ultra, Shadow Quality = Ultra, Mirrors Reflection Quality = High, SSR Quality = High, Variable Rate Shading = Quality. Разрешение 3840 × 2160: Super Sampling = 1.0, Level of Detail = Ultra, Texture Quality = High, Texture Filter = Anisotropic 16x, SSAO = Ultra, Shadow Quality = Ultra, Mirrors Reflection Quality = High, SSR Quality = High, Variable Rate Shading = Quality.
  • Metro Exodus. Разрешение 1920 × 1080: DirectX 12, Quality = Ultra, Texture Filtering = AF 16X, Motion Blur = Normal, Tesselation = Full, Advanced PhysX = Off, Hairworks = Off, Ray Trace = Off, DLSS = Off. Разрешение 3840 × 2160: DirectX 12, Quality = Ultra, Texture Filtering = AF 16X, Motion Blur = Normal, Tesselation = Full, Advanced PhysX = Off, Hairworks = Off, Ray Trace = Off, DLSS = Off.
  • Shadow of the Tomb Raider. Разрешение 1920 × 1080: DirectX12, Preset = Highest, Anti-Aliasing = TAA. Разрешение 3840 × 2160: DirectX12, Preset = Highest, Anti-Aliasing = Off.
  • A Total War Saga: Troy. Разрешение 1920 × 1080: DirectX 12, Quality = Ultra, Unit Size = Extreme. Разрешение 3840 × 2160: DirectX 12, Quality = Ultra, Unit Size = Extreme.
  • Watch Dogs Legion. Разрешение 1920 × 1080: DirectX 12, Quality = Ultra, RTX = Off, DLSS = Off. Разрешение 3840 × 2160: DirectX 12, DirectX 12, Quality = Ultra, RTX = Off, DLSS = Off.
  • World War Z. Разрешение 1920 × 1080: DirectX11, Visual Quality Preset = Ultra. Разрешение 3840 × 2160: DirectX11, Visual Quality Preset = Ultra.

Во всех игровых тестах в качестве результатов приводится среднее количество кадров в секунду, а также 0,01-квантиль (первая перцентиль) для значений FPS. Использование 0,01-квантиля вместо показателей минимального FPS обусловлено стремлением очистить результаты от случайных всплесков производительности, которые были спровоцированы не связанными напрямую с работой основных компонентов платформы причинами.

⇡#IPC

В первую очередь давайте разберёмся с описанной процессорами Ryzen траекторией показателя IPC, то есть с тем, как менялась их удельная производительность. Такое исследование нужно для удовлетворения академического любопытства и оценки эффективности микроархитектур от Zen до Zen 3 в чистом виде. Дело в том, что процессоры в каждом поколении становятся быстрее не только за счёт микроархитектуры, но и в том числе и за счёт повышения рабочих частот. Например, максимальная рабочая частота Ryzen 7 5800X в конечном итоге превысила оную у Ryzen 7 1800X на 15 %, демонстрируя прирост на каждом этапе. Вместе с последовательными улучшениями в технологии авторазгона Precision Boost это заметно улучшает быстродействие и маскирует реальный прирост IPC, который получается от микроархитектурных улучшений.

Чтобы выделить из всей картины рост производительности, обусловленный исключительно интересующим нас фактором, мы сравнили восьмиядерные Ryzen разных поколений при одной и той же фиксированной тактовой частоте. Конкретно было выбрано значение 4,0 ГГц – на этой частоте способны работать Ryzen всех поколений, несмотря на разницу в используемых техпроцессах. Оперативная память во всех случаях также работала одинаково – в режиме DDR4-3200.

В следующей таблице приводятся результаты сравнения четырёх одночастотных восьмиядерников в ресурсоёмких приложениях и тот прирост производительности, который фиксируется при переходе от процессора одного поколения к следующему.

Как видно из приведённой таблицы, максимальный взлёт вычислительной производительности произошёл при переходе от Zen+ (Pinnacle Ridge) к Zen 2 (Matisse). На этом этапе рост быстродействия в некоторых случаях достигает 30-40 %, и это закономерно, ведь в Zen 2 компания AMD удвоила и скорость работы FPU-блока, и объём доступной кеш-памяти. В результате при равной тактовой частоте процессоры Ryzen 3000 опережают предшественников серии Ryzen 2000 в среднем на 22,8 %.

Что касается новейшего поколения Ryzen 5000 на базе микроархитектуры Zen 3, то оно принесло далеко не такой мощный прирост. Если сравнивать с Ryzen 3000, то в среднем в ресурсоёмких приложениях наблюдается лишь 11-процентное увеличение удельной производительности, то есть улучшения в Zen 3 оказались далеко не столь монументальными, как те усовершенствования, которые произошли на предыдущем этапе модернизации микроархитектуры. Впрочем, нельзя сказать, что мы разочарованы. Два поколения подряд AMD удаётся добиваться роста быстродействия на двузначное число процентов – это очень впечатляющий прогресс.

Если же говорить о картине в целом, то с момента выхода первых Zen показатель IPC вырос на 42,5 %, и это число выглядит действительно фантастическим, так как на достижение такого результата AMD потратила всего четыре года.

Мы не поместили на этот график результат процессора с микроархитектурой Intel Skylake, однако он был протестирован наряду с различными Ryzen. И полученные данные свидетельствуют: с точки зрения IPC массовых чипов AMD обошла конкурента на этапе выхода Ryzen 3000 с микроархитектурой Zen 2. При одинаковой тактовой частоте Matisse обходит Skylake в среднем на 7,7 %. Преимущество же Vermeer и микроархитектуры Zen 3 достигло уже 19,4 %. Именно такое отставание Intel нужно попробовать наверстать в процессорах Rocket Lake.

В играх, которые создают несколько иную по своему характеру нагрузку, ситуация, естественно, сильно отличается. В этом можно убедиться с помощью следующей таблицы с показателями средней частоты кадров в разрешении Full HD при максимальных настройках качества изображения. Условия тестирования при этом остаются теми же – мы сравниваем восьмиядерники на фиксированной частоте 4,0 ГГц.

В то время как максимальный прирост в удельной вычислительной производительности фиксировался при переходе от процессора Pinnacle Ridge к Matisse, то есть при вводе в строй микроархитектуры Zen 2, для игрового быстродействия гораздо более важным свершением стало появление дизайна Zen 3. Средняя кадровая частота Ryzen 5000 выросла сразу на 16,4 %, если сравнивать с показателями Ryzen 3000, и очевидно, что самый значительный вклад в этот прирост внесло внедрение восьмиядерных CCX-модулей вместо четырёхъядерных. Вопрос неэффективного межъядерного взаимодействия в современных Ryzen больше не стоит, и это выпукло отражается на игровых результатах.

Если посмотреть на то, как прогрессировала средняя геймерская производительность процессоров AMD на протяжении четырёх поколений CPU, то получится, что с первых Zen, которые вышли в 2017 году, обеспечиваемая ими кадровая частота поднялась в среднем на 36 % – очень весомый результат, который наверняка способен заставить обладателей Ryzen 1000 или Ryzen 2000 серьёзно задуматься о модернизации процессора. И кстати, хорошо видно, что микроархитектура Zen 3 подняла удельную игровую производительность сильнее, чем это сделали два предыдущих поколения массовых процессоров. Иными словами, представители семейства Ryzen 5000 получили звание лучших вариантов для геймерских систем именно благодаря этому последнему рывку.

То, что случилось в Ryzen свежего поколения, вывело их удельную производительность выше уровня Intel Skylake не только в ресурсоёмких приложениях, но и в играх. До выхода Verneer процессоры Intel предлагали лучший игровой IPC, но теперь AMD может похвастать убедительным преимуществом и в этой сфере тоже. Причём величина превосходства Vermeer над Skylake на одинаковой тактовой частоте в среднем составляет заметные 10 %. Правда, нужно оговориться, что эта величина получена при условии использования мощной графической карты GeForce RTX 3090, а для более слабой графики разрыв будет получаться меньшим.

Но в итоге этого небольшого исследования IPC процессоров Ryzen различных поколений мы вынуждены отметить, что, несмотря на явное движение вперёд, AMD всё же излишне оптимистично оценивает результативность своей работы. Хотя компания утверждала, что удельная производительность Zen 3 выросла по сравнению с показателями Zen 2 на 19 %, по результатам наших измерений получается, что речь идёт скорее о 11 %. Или же если взять в рассмотрение не только вычислительные задачи, но и игры, то этот показатель можно оценить величиной 13 %, что всё равно заметно меньше официально объявленного показателя.

⇡#Производительность в комплексных тестах

Переходим к сравнению процессоров в номинальном режиме – без искусственного ограничения их тактовой частоты.

Тест PCMark 10, который должен показывать средневзвешенную производительность систем при обыденном домашнем или офисном использовании, не преподносит никаких сюрпризов. Каждый следующий Ryzen быстрее предыдущего, причём на достаточно отчётливую величину и в любых сценариях. Но особо обратить внимание стоит на два факта. Во-первых, по мнению PCMark 10, превзойти Intel Core компании AMD удалось только в последнем поколении своих процессоров, которое основывается на микроархитектуре Zen 3. Во-вторых, величина прироста при переходе от Ryzen двухтысячной серии к трёхтысячной серии и на следующем шаге – при переходе к пятитысячной серии – примерно одинакова. То есть эффект, которого добивается AMD на каждом шаге совершенствования микроархитектуры, в целом оказывается примерно равным. Из этого ряда выбивается разве только переход от Ryzen 1000 к Ryzen 2000, но эту ступень в развитии AMD и не считает полноценной, маркируя второе поколение микроархитектуры «промежуточным» наименованием Zen+.

Тест 3DMark даёт оценку игровой производительности, но в целом картина здесь похожа на то, что мы видели в PCMark 10. Особо выделить можно разве только то, что, по данным процессорного теста, разрыв между Ryzen 7 5800X и Ryzen 7 1800X достигает 64 %. А это значит, что если AMD продолжит двигаться теми же темпами и дальше, то можно ожидать, что следующее поколение Ryzen будет быстрее первых носителей микроархитектуры Zen (аналогичного класса) уже примерно вдвое.

⇡#Производительность в приложениях

Считается, что при создании и обработке цифрового контента процессоры Ryzen были достаточно сильны всегда. Но на самом деле изначально AMD брала верх над Intel грубой силой: за счёт превосходства в числе вычислительных ядер. При этом по удельной производительности на ядро процессоры Ryzen смогли сделать рывок в рабочих задачах лишь после внедрения микроархитектуры Zen 2, где AMD расширила блок FPU и наделила его способностью работы с 256-битными данными не в два этапа, а целиком. В результате Ryzen 7 3800XT получил 30-процентное преимущество перед Ryzen 7 2700X и обошёл по быстродействию Core i7-10700K (и аналогичный по характеристикам Core i9-9900K).

Надо сказать, что неплохую результативность показывает и последняя итерация микроархитектуры AMD – Zen 3. В среднем Ryzen 7 5800X выигрывает у Ryzen 7 3800XT 18 %. Однако здесь есть один интересный нюанс. Процессоры трёхтысячной серии получили максимальный прирост в приложениях, направленных на работу с фото и видео: например, Ryzen 7 3800XT оказывается быстрее Ryzen 7 2700X в Lightroom или при перекодировании видео современными кодеками в целых полтора раза. Ryzen 7 5800X же предлагает максимальный прирост на вычислениях другой направленности – при рендеринге в пакетах трехмерного моделирования.

В сумме же если сопоставить новейший Ryzen 7 5800X и процессор Ryzen 7 1800X четырёхлетней давности, то получится, что за это время производительность предложений AMD в ресурсоёмких задачах смогла возрасти в среднем на 69 %. Причём максимальный прирост достигнут в видеокодеках – здесь ускорение доходит до впечатляющего 90-процентного уровня.

Рендеринг:

Обработка фото:

Работа с видео:

Перекодирование видео:

Компиляция:

Архивация:

Шахматы:

Шифрование:

⇡#Производительность в играх. Тесты в разрешении 1080p

Игровая производительность Ryzen долго была их слабым местом. Но в микроархитектуре Zen 3 компания AMD наконец-то избавилась от главной структурной проблемы в своих процессорах, которая не давала им возможности проявить себя в играх, – она объединила в CCX-комплексах по восемь ядер и значительно снизила задержки при межъядерных взаимодействиях. Вместе с мерами, принятыми ранее, — в первую очередь с увеличением размера кеш-памяти третьего уровня в Zen 2, — это дало очень мощный эффект, и в конечном итоге современные процессоры Ryzen в играх стали как минимум в полтора раза быстрее родоначальников семейства. Этот прирост распределяется так: Ryzen 7 3800XT превосходит Ryzen 7 2700X примерно на 13 %, а Ryzen 7 5800X быстрее, чем Ryzen 7 3800XT, в среднем на 20 %. Оставшиеся 10 % приходятся на шаг от Ryzen 7 1800X к Ryzen 7 2700X.

В результате теперь вполне правомерно говорить, что старший восьмиядерник AMD последнего поколения, Ryzen 7 5800X, обходит восьмиядерники Intel не только при расчётах, но и в играх. Преимущество в этом случае нельзя назвать подавляющим, но не заметить его тоже нельзя. А это значит, что окончательную победу над Skylake компания AMD одержала только сейчас – с вводом в строй микроархитектуры Zen 3. Впрочем, игры, где Skylake всё ещё силён, существуют, и они далеко не единичны.

⇡#Производительность в играх. Тесты в разрешении 2160p

Что характерно, рост игровой производительности по мере совершенствования микроархитектуры процессоров AMD прослеживается даже в том случае, если речь идёт о разрешении 4K. Несмотря на то, что в этом случае большая часть нагрузки падает на видеоподсистему, первые Ryzen явно не готовы для работы в системах с мощной графикой, даже если такие системы нацелены на игры в высоких разрешениях. Но микроархитектура Zen 3 оставила все подобные проблемы в прошлом. Тот же Ryzen 7 5800X отлично подойдёт для абсолютно любой игровой системы, и, больше того, в среднем такая система будет выдавать более высокую кадровую частоту, чем аналогичная конфигурация с восьмиядерным процессором Core i7-10700K (или Core i9-9900K).

⇡#Энергопотребление

За время эволюции процессоров Ryzen техпроцесс менялся дважды: с 14 на 12 нм при переходе к микроархитектуре Zen+, а затем на 7 нм на следующем этапе – при смене микроархитектуры на Zen 2. Однако открывающиеся возможности компания AMD обращает не в снижение потребления и тепловыделения, а в рост тактовых частот. Поэтому не стоит удивляться, что у всех старших восьмиядерных Ryzen спецификацией устанавливается одинаковая величина предельного потребления 142 Вт. Именно исходя из этой константы процессоры Ryzen динамически управляют своей тактовой частотой, а потому особых различий в их реальных энергетических аппетитах не наблюдается. По крайней мере в тех случаях, когда они загружены многопоточной вычислительной работой.

Подтвердить всё это можно следующими графиками, на которых приведено полное потребление тестовых систем, измеренное после блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД самого блока питания в данном случае не учитывается.

Немного выделяется на общем фоне только Ryzen 7 1800X, который, кажется, потребляет меньше собратьев. Однако объясняется это отнюдь не лучшей экономичностью данного процессора, а тем, что мы измеряем потребление платформы целиком, и в случае с Ryzen 7 1800X в тесты попала другая материнская плата, основанная на чипсете X470, а не X570. Такие материнки заметно экономичнее, что и обуславливает более низкие показатели потребления у самого старого из участников теста.

⇡#Выводы

В материале, подобном сегодняшнему, довольно сложно сформулировать какие-то чёткие выводы. То, что производительность с переходом к каждому последующему поколению процессоров растёт, – это вполне очевидный факт. Удивить тут может разве только то, что у AMD этот прирост опирается на усовершенствования в микроархитектуре и оказывается хорошо заметным почти на каждом шаге. Intel приучила нас к очень размеренному (а в последние годы – вообще нулевому) увеличению удельного быстродействия, когда, несмотря на ежегодную смену поколений CPU, рост производительности происходит за счёт увеличения тактовой частоты и числа вычислительных ядер. С продукцией же AMD всё обстоит совершенно по-другому. Здесь каждое новое поколение процессоров становится быстрее в первую очередь благодаря изменениям в микроархитектуре, а лишь только потом – благодаря росту частоты и увеличению числа ядер.

Тестирование выявило, что сама AMD в пределах нескольких процентов систематически завышает свои обещания по росту показателя IPC. Однако сути это не меняет. Ryzen второго поколения — с учётом IPC и роста частоты — быстрее своего предшественника примерно на 10 %. Третье поколение Ryzen прибавило в производительности ещё на 30 %. А современные процессоры пятитысячной серии принесли ещё 18 % прироста. Это значит, что продукция AMD устаревает очень и очень быстро, с одной стороны, подстёгивая развитие компьютерного рынка, но с другой – заставляя пользователей чаще обновлять системы. На протяжении всего тестирования нам то и дело приходилось указывать, что Ryzen тысячной и двухтысячной серии сегодня выглядят уже весьма неубедительно — как в творческих приложениях, так и в играх.

Более того, в двух последующих поколениях Ryzen компания AMD так разогналась, что не только отправила свои предшествующие решения в разряд устаревших, но и лихо обскакала процессоры Intel, превратив бывшего рекордсмена в безнадёжного отстающего. Если говорить о ресурсоёмких приложениях, то современных представителей серии Intel Core процессоры Ryzen с аналогичным числом ядер обогнали ещё в трёхтысячной серии, а в пятитысячной серии они утвердили своё превосходство и в играх. В результате среднее преимущество Ryzen 7 5800X перед Core i7-10700K в вычислительных задачах достигает 20 %, а превосходство в игровых приложениях находится на уровне 5 %.

В рамках этого материала мы говорили исключительно про восьмиядерные процессоры, но, помимо роста IPC и тактовых частот, у AMD есть и ещё один сильный аргумент – умение выпускать потребительские процессоры с 12 и 16 ядрами, аналогов которым среди предложений Intel попросту не существует. Это – ещё одна причина, по которой Ryzen заслуживают почёта и славы.

Но финалом этой статьи мы бы хотели сделать два очень показательных числа, ради которых всё это тестирование и затевалось. А именно: самый современный старший восьмиядерник Ryzen 7 5800X обходит по производительности флагманский Ryzen 7 первого поколения на 69 %, если говорить о приложениях, и на 52 % – если говорить об играх в разрешении Full HD с мощной графической картой (в скобках при этом заметим, что при сравнении Ryzen 7 5800X с Ryzen 7 2700X эти числа останутся тоже весьма убедительными – 53 и 36 % соответственно).

If you notice an error, select it with the mouse and press CTRL + ENTER.

Leave a Comment