Ресурс ChipsAndCheese провел необычный тест по определению задержек памяти графических процессоров разных производителей и архитектур. С этой целью использовались алгоритмы поиска указателей памяти в OpenCL.

Для начала были рассмотрены самые современные графические архитектуры AMD RDNA 2 и Nvidia Ampere на примере видеокарт Radeon RX 6800 XT и GeForce RTX 3090 соответственно. Конечный результат ярко демонстрирует разный подход к организации кэш-памяти у конкурирующих фирм и наличие отдельного массива Infinity Cache у Radeon RX 6000.

Задержки L1 немного ниже у GeForce RTX 3090. Однако затем в более выигрышном положении оказывается Radeon RX 6800 XT на всей «глубине» запросов, пока дело не доходит до задержек VRAM. В этом случае показатели обоих графических адаптеров сравниваются. Нельзя не отметить большой скачок (100+ нс) при переходе от L1 к L2 у чипа GA102.  

Если сравнивать CPU против GPU, то даже не самый современный процессор Intel Core i7-4770 с оперативной памятью DDR3-1600 CL9 в несколько раз опережает видеокарту Radeon 6900 XT. В области кэша L1 разрыв превышает десятикратный размер.

Далее ChipsAndCheese сравнил видеокарты прошлых поколений. Если взять Nvidia, то Maxwell и Pascal близки к друг другу, что объясняется их архитектурной схожестью. Turing вырывается вперед по задержкам L1 и в этом плане похож на Ampere.

Со стороны «красной» команды, Terascale 2 и Terascale 3 идут параллельно друг другу (что не удивительно), а серьезный качественный переход заметен на GCN первого поколения. В свою очередь RDNA 2 заметно опережает GCN 1.0, но в области кэша L1 выигрыш меньше, чем в остальном диапазоне.

Напоследок стоит обратить внимание, что результаты первого раздела (Radeon RX 6800 XT и GeForce RTX 3090) не сопоставимы с последующими поскольку они используют другую версию алгоритма.