RDNA 3 Radeon RX 7900 XT con 15,360 núcleos, Ada Lovelace GeForce RTX 4090 con 18,432 núcleos

Posted On: noviembre 12, 2021
Posted By: Merlín Santistevan
Comments: 0

Las especificaciones de las que se rumorea para las tarjetas gráficas GeForce RTX 4090 de próxima generación impulsadas por las tarjetas gráficas Radeon RX 7900 XT y NVIDIA Ada Lovelace de próxima generación AMD RDNA 3 se detallan una vez más. Los rumores vienen de Grimon 55 quien ha estado publicando activamente detalles sobre el próximo hardware como CPU y GPU en su cuenta de Twitter por un tiempo.

AMD RDNA 3 y NVIDIA Ada Lovelace GPU con tecnología de tarjetas gráficas detalladas Radeon RX 7900 XT y GeForce RTX 4090 insignia de próxima generación

Se espera que las GPU AD102 con tecnología AMD RDNA 3 brinden enormes mejoras de rendimiento y también sean el conjunto de chips que más energía consuma. Si bien NVIDIA apunta a adoptar un enfoque monolítico con su arquitectura Ada Lovelace, AMD utilizará el diseño MCM completo que ya ha adoptado con el lanzamiento de la serie MI200 «Aldebaran» 2 con tecnología CDNA. AMD aprovechará ahora la misma tecnología MCM para las GPU de juegos y de consumo. Hablemos de las últimas especificaciones que se rumorea que obtuvimos del filtrador:

Módulo de memoria SK Hynix HBM3 revelado durante OCP Summit 2021-12-Hi Stack, módulo de 24 GB con velocidades de transferencia de 6400 Mbps

M 102
TSMC de 5 nm
144SM 18432CUDA
384 bits 24G DDR6X 21Gbps？
2,3 ~ 2,5 GHz？
85 ~ 92T FP32？

– Greymon55 (@ greymon55) 9 de noviembre de 2021

Tarjeta gráfica AMD Radeon RX 7900 XT – GPU insignia Navi 31 con RDNA 3

La GPU AMD Navi 31, el chip insignia RDNA 3, alimentará la tarjeta gráfica Radeon RX 7900 XT de próxima generación. Hemos escuchado que AMD dejará CU (Unidades de Computación) a favor de WGP (Procesadores de Grupo de Trabajo) en sus GPU RDNA 3 de próxima generación. Dado que Navi 31 es una GPU MCM, tendrá dos direcciones IP principales, la GCD (Gráficos Core Template)) basado en el proceso de 5 nm de TSMC y MCD (plantilla de caché múltiple) basado en el nodo de proceso de 6 nm de TSMC. Los rumores anteriores indican que AMD ha Ya extraje su plantilla de GPU Navi 31.

La configuración de la GPU Navi 31 que se muestra aquí presenta dos GCD (plantilla de núcleo gráfico) y un MCD (plantilla de caché múltiple). Cada GCD contiene 3 Shader Engines (6 en total) y cada Shader Engine contiene 2 Shader Arrays (2 por SE / 6 por GCD / 12 en total). Cada Shader Array consta de 5 WGP (10 por SE / 30 por GCD / 60 en total) y cada WGP comprende 8 unidades SIMD32 con 32 ALU (40 SIMD32 por SA / 80 por SE / 240 por GCD / 480 en total). Estos módulos SIMD32 se combinan para formar 7,680 núcleos por GCD y 15,360 núcleos en total.

READ Cómo desactivar Google Maps 3D en Android Auto y CarPlay

En cuanto al rendimiento, se espera que la GPU tenga una velocidad de reloj de 2,4 a 2,5 GHz, lo que sitúa su rendimiento teórico en alrededor de 75 TFLOP (FP32). Esa es una increíble mejora del 226% con respecto a la tarjeta gráfica Radeon RX 6900 XT.

El nuevo algoritmo Raptoreum Crypto Mining convierte las CPU AMD Ryzen con cachés L3 masivos en máquinas generadoras de dinero

El MCD Navi 31 (RDNA 3) se conectará a GCD duales a través de Infinity Fabric interconectado de próxima generación y contará con 256-512 MB de caché Infinity. Cada GPU también debe tener 4 puentes de memoria (32 bits). Este es un total de 8 controladores de memoria de 32 bits para una interfaz de bus de 256 bits. Se informa que la tarjeta incluirá hasta 32 GB de memoria GDDR6 operando a velocidades de 18 GB por segundo, lo que proporciona un ancho de banda de hasta 576 GB / s. Otro rumor que ha surgido recientemente es que AMD Utilizará 3D Infinity Cache En la alineación RDNA 3 que integrará la nueva caché en grupos verticales en GPU, similar al método Los chips Vermeer-X apilarán la caché L3 encima del CCD.

AMD RDNA GPU primaria (comparación de generaciones):

Nombre de la GPU	Navi 10	Navi 21	Navi 31
Operación de GPU	7 nm	7 nm	5 nm (6 nm?)
Paquete de GPU	congénere	congénere	MCD (plantilla de varios chips)
Motores de sombreado	2	4	6
GPU WGP	20	40	30 (por MCD) 60 (en total)
SP por WGP	128	128	256
Unidades de cálculo (por plantilla)	40	80	120 (por MCD) 240 (en total)
núcleos (por dado)	2560	5120	7680
colores (total)	2560	5120	15360 (2 x MCD)
Bus de memoria	256 bits	256 bits	256 bits
tipo de memoria	GDDR6	GDDR6	GDDR6
caché infinito	No disponible	128 MB	256-512 MB
SKU principal	Radeon RX 5700 XT	Radeon RX 6900 XTX	Radeon RX 7900 XT
TBP	225 W	330W	420-450W
lanzamiento	Tercer trimestre de 2019	Cuarto trimestre de 2020	Cuarto trimestre de 2022

READ La E-Bike de Urtopia pronto usará ChatGPT para ayudarlo a navegar por su informe Ride Rob

Tarjeta gráfica NVIDIA GeForce RTX 4090 – GPU insignia AD102 con tecnología Ada Lovelace

Según rumores anteriores, hubo rumores de que NVIDIA estaría usando el nodo de proceso N5 (5nm) de TSMC para sus GPU Ada Lovelace. Esto también incluye el SKU AD102, que será un diseño completamente roscado. En su tweet reciente que habla sobre configuraciones específicas de GPU, se dice que la GPU AD102 presenta una velocidad de reloj de hasta 2.5GHz (el aumento promedio es 2.3GHz). Un tweet específico afirma que el reloj de la GPU de Ada Lovelace ‘AD102’ podría ser de 2,3 GHz o más, así que tomemos eso como referencia y especificaciones filtradas previamente para ver dónde debería aterrizar el rendimiento.

La NVIDIA AD102 «ADA GPU» parece tener 18,432 núcleos CUDA basados en especificaciones en bruto (que pueden cambiar), alojados en 144 unidades SM. Eso es casi el doble de los núcleos en Ampere, que ya fue un movimiento masivo de Turing. La velocidad de reloj de 2,3-2,5 GHz nos proporciona hasta 85 a 92 TFLOP de rendimiento informático (FP32). Esto es más del doble del rendimiento del FP32 que el RTX 3090 actual, que incluye 36 TFLOP de potencia de cómputo FP32.

El salto de rendimiento del 150% parece enorme, pero hay que recordar que NVIDIA realmente dio un gran salto en los números de FP32 de esta generación con el Ampere. La GPU Ampere GA102 (RTX 3090) ofrece 36 TFLOP, mientras que la GPU Turing TU102 (RTX 2080 Ti) ofrece 13 TFLOP. Este es un aumento de más del 150% en FP32 Flops, pero el aumento del rendimiento de juegos en el mundo real para el RTX 3090 promedió un 50-60% más rápido que el RTX 2080 Ti. Entonces, lo único que no debemos olvidar es que Flops no iguala el rendimiento de los juegos de la GPU en estos días. Además, no sabemos si 2,3-2,5 GHz es el aumento promedio o el aumento máximo, ya que lo primero significa que puede haber un mayor potencial informático para el AD102.

READ Los jugadores de Gran Turismo Sport han comprado 300.000 modelos Toyota GR Yaris

Aparte de eso, el filtrador también menciona que la insignia NVIDIA GeForce RTX 40 mantendrá su interfaz de bus de 384 bits, similar a la RTX 3090. Curiosamente, el filtrador menciona el G6X, lo que significa que NVIDIA no se moverá al nuevo estándar de memoria. hasta después de Ada Lovelace y aproveche las velocidades más rápidas. El pin más alto de 21 Gbps del G6X es para tarjetas de próxima generación antes de que veamos un estándar más nuevo (como GDDR7). La tarjeta contará con 24 GB de memoria, por lo que podemos esperar una DRAM de una cara de 16 GB o una DRAM de dos caras de 8 GB.

Introducción a la GPU NVIDIA CUDA (se rumorea):

GPU	TU102	GA102	M 102
Ingeniería arquitectónica	Turing	Amperio	Ada Lovelace
Procesando	TSMC 12 nm NFF	Samsung 8nm	5 nm
Kits de procesamiento de gráficos (GPC)	6	7	12
Kits de procesamiento de textiles (TPC)	36	42	72
flujo multiprocesador (SM)	72	84	144
colores Koda	4608	10752	18432
TFLOP teóricos	16,1	37,6	~ 90 TFLOPs?
tipo de memoria	GDDR6	GDDR6X	GDDR6X
Bus de memoria	384 bits	384 bits	384 bits
Capacidad de memoria	11 GB (2080T)	24 GB (3090)	24 GB (4090?)
SKU principal	RTX 2080 Ti	RTX 3090	RTX 4090?
TGP	250 vatios	350W	450-650 vatios?
lanzamiento	Septiembre de 2018	20 de septiembre	2022 (por confirmar)

Las GPU NVIDIA Ada Lovelace impulsarán las tarjetas gráficas GeForce RTX 40 de próxima generación que serán compatibles con las tarjetas gráficas AMD RDNA 3 Radeon RX 7000. Todavía hay algunas especulaciones sobre el uso de MCM por parte de NVIDIA. GPU Hopper, que se dirige principalmente al segmento de centros de datos e inteligencia artificial, Se afirma que el registro llegará pronto. Contará con arquitectura MCM. NVIDIA no utilizará el diseño MCM en sus GPU Ada Lovelace, por lo que mantendrá el diseño tradicional monolítico.

¿Qué GPU de próxima generación esperas más?