Intel Xe | ||
---|---|---|
![]() | ||
Información | ||
Tipo | Microarquitectura | |
Desarrollador | Intel | |
Fabricante | TSMCN6 | |
Fecha de lanzamiento | 2 de septiembre de 2020 (4 años) | |
Usado en | ||
Iris Xe Graphics Intel Arc | ||
Intel Xe (estilizado comoXe y pronunciado como dos letras separadas,[1] abreviatura de "eXascale foreveryone"[2]), anteriormente conocido extraoficialmente comoGen12,[3][4] es unaarquitectura deGPU desarrollada porIntel.[5]
Intel Xe incluye una nuevaarquitectura de conjunto de instrucciones. La familia de GPU Xe consta de una serie de microarquitecturas, que van desde integradas/de bajo consumo (Xe-LP),[6] hasta entusiastas/juegos de alto rendimiento (Xe-HPG), centro de datos/alto rendimiento (Xe-HP) y alto rendimiento. informática (Xe-HPC).[7][8]
El primer intento de Intel de unatarjeta gráfica dedicada fue laIntel740,[9] lanzada en febrero de 1998. Se consideró que el Intel740 no tuvo éxito debido a que su rendimiento fue inferior a las expectativas del mercado, lo que provocó que Intel dejara de desarrollar futuros productos de gráficos discretos. Sin embargo, su tecnología perduró en la líneaIntel Extreme Graphics.[10] Intel hizo otro intento con la arquitecturaLarrabee antes de cancelarla en 2009;[11] esta vez, la tecnología desarrollada se utilizó en elXeon Phi, la cual tras ser lanzada durante 2012 comocoprocesadores vectoriales especializados no como tarjetas gráficas, sino como tarjetas de cálculos parasupercomputación, sería discontinuada en 2020.[12]
En abril de 2018, se informó queIntel estaba reuniendo un equipo para desarrollarunidades de procesamiento de gráficos discretos, dirigidas tanto a loscentros de datos como al mercado dejuegos de PC y, por lo tanto, competitivos con los productos deNvidia yAMD.[13] Los rumores que respaldaban la afirmación incluían que la compañía tenía vacantes para más de 100 trabajos relacionados con gráficos y que había contratado al exlíder deRadeon Technologies Group (AMD), Raja Koduri, a fines de 2017; se informó que el nuevo producto tenía el nombre en código "Arctic Sound".[13] Se informó que el proyecto inicialmente estaba dirigido a chips de transmisión de video para centros de datos, pero su alcance se amplió para incluir GPU de escritorio.[13]
En junio de 2018, Intel confirmó que planeaba lanzar una GPU discreta en 2020.[14] Se informó que la primera GPU "Xe" discreta funcional, con nombre en código "DG1", comenzó a probarse en octubre de 2019.[15]
Según un informe deHexus a fines de 2019, se lanzaría una GPU discreta a mediados de 2020; También se esperaban productos combinados de GPU/CPU (GPGPU), para centros de datos y aplicaciones deconducción autónoma. Se esperaría que el producto se construyera inicialmente en un nodo de10 nm (con productos de7 nm en 2021) y utilizara la tecnología de empaquetado de apilamiento dechips 3D, Intel Foveros.[16] Durante 2020, se lanzarían los primeros chips con el nombre de Intel Iris Xe Max, integrados en los procesadores Intel Core de 11.ª generación (nombre en código "Tiger Lake" y "Rocket Lake"),[4] seguidos en 2021 por algunas tarjetas Iris Xe DG1, exclusivas para integradoresOEM de Intel.[17] Finalmente y tras algunos retrasos, el lanzamiento a la venta directa de estas primeras tarjetas gráficas dedicadas de la compañía en más de 20 años, conocidas como la serieIntel Arc, ocurriría en el transcurso de 2022.[18]
Intel Xe amplía la revisión demicroarquitectura introducida enGen 11 con una refactorización completa de laarquitectura del conjunto de instrucciones.[19][4] Si bien Xe es una familia de arquitecturas, cada variante tiene diferencias significativas entre sí, ya que están diseñadas teniendo en cuenta sus objetivos. La familia de GPU Xe consta de subarquitecturas Xe-LP, Xe-HP, Xe-HPC y Xe-HPG.
A diferencia de las unidades de procesamiento de gráficos Intel anteriores que usaban la Unidad de Ejecución (EU) como unidad de cómputo, Xe-HPG y Xe-HPC usan el Xe-core.[20] Esto es similar a un subsegmento Xe-LP.[20] Un Xe-core contieneunidades lógicas aritméticas vectoriales y matriciales, que se denominan motores vectoriales y matriciales. Otros componentes incluyen caché L1 y otro hardware.[20][21]
Xe-LP es la variante de bajo consumo de la arquitectura Xe.[6] Xe-LP está presente como gráficos integrados para Intel Core de 11.ª generación y la GPU móvil dedicada Iris Xe MAX (nombre en código DG1), así como en la GPU H3C XG310 Intel Server (nombre en código SG1).[4] En comparación con su predecesor, Xe-LP incluye nuevas características como Sampler Feedback,[22] Dual Queue Support,[23] DirectX12 View Instancing Tier2,[24] y decodificación de hardware de función fijaAV1 de 8 y 10 bits.[25]
Xe-HP es la variante de centro de datos/alto rendimiento de Xe, optimizada para el rendimiento deFP64 y laescalabilidad de varios mosaicos.[5]
Xe-HPC es la variante informática de alto rendimiento de la arquitectura Xe.[7][8] Un Xe-HPC Xe-core contiene 8 motores vectoriales y 8 matriciales, junto con un gran 512 Caché KB L1.[26] Alimenta Ponte Vecchio.
Xe-HPG es la variante gráfica entusiasta o de alto rendimiento de la arquitectura Xe. La microarquitectura se basa en Xe-LP con mejoras de Xe-HP y Xe-HPC.[27] La microarquitectura se centra en el rendimiento de los gráficos y admite trazado de rayos acelerado por hardware,[7][28] DisplayPort 2.0,[29] XeSS o supermuestreo basado en redes neuronales (similar aNvidia DLSS) yDirectX 12 Ultimate.[30] Intel confirmó que la compatibilidad con ASTC se eliminó del hardware a partir de Alchemist y que las futuras microarquitecturas de GPUIntel Arc tampoco la admitirán.[31] Un Xe-HPG Xe-core contiene 16 motores vectoriales y 16 motores matriciales.[21] Una porción de renderizado Xe-HPG constará de cuatro núcleos Xe, hardware de trazado de rayos y otros componentes.[21]
Se reveló un sucesor de Xe durante Intel Architecture Day 2021, bajo el nombre de Xe 2, cuyo nombre en código es Battlemage. Actualmente se encuentra en desarrollo.[21] En una entrevista exclusiva con HardwareLuxx, Tom Peterson confirmó que Xe2 se segmentará en "Xe2-LPG" (Gráficos de bajo consumo) paraGPU integradas y "Xe2-HPG" (Gráficos de alto rendimiento) paraGPU discretas.[32]
Intel Xe 3 es el próximo sucesor de la microarquitectura Intel Xe 2 con nombre en código Celestial y su lanzamiento está programado para 2024 según la hoja de ruta de GPU de Intel.[21]
Intel Xe 4 es el próximo sucesor de la microarquitectura Intel Xe 3 con nombre en código Druid.[33]
Los procesadores Intel más nuevos utilizan la microarquitectura Xe-LP. Estos incluyen procesadores Intel Core de 11.ª generación (nombre en código "Tiger Lake" y "Rocket Lake"),[4] procesadores Intel Core de 12.ª generación (nombre en código "Alder Lake") y procesadores Intel Core de 13.ª generación (nombre en código "Raptor Lake").
Modelo | Lanzamiento | Proceso | Ejecución unidades | Unidades de sombreado | Velocidades de reloj | Memoria | Poder de procesamiento (GFLOPS) | Notas | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Reloj turbo (MHz) | Memoria (MT/s) | Tamaño (GB) | Ancho de banda (GB/s) | Tipo de bus | Ancho del bus (bit) | Medio | Simple | Doble | INT8 | ||||||
Iris XeMAX | 1 de noviembre de 2020 | Intel 10SF | 96 | 768 | 1650 | 4266 | 4 | 68 | LPDDR4x | 128 | 5069 | 2534 | 1267 | 10138 |
En agosto de 2020, se informó que Intel enviaría GPU Xe DG1 para un posible lanzamiento a fines de 2020, al tiempo que comentó sobre una GPU DG2 dirigida al mercado entusiasta (más tarde se descubrió que era la primera generación deIntel Arc apodada "Alchemist"). La DG1 también se vende como Iris Xe MAX y como Iris Xe Graphics (estilizado comoiRIS Xe) en portátiles, mientras que las tarjetas para desarrolladores se venden como DG1 SDV.[34][35]
La Xe MAX es una GPU de nivel de entrada que se lanzó por primera vez el 1 de noviembre de 2020 enChina y es similar en la mayoría de los aspectos a la GPU integrada que se encuentra en los procesadores Tiger Lake, las únicas diferencias son una velocidad de reloj más alta, un rendimiento ligeramente superior y memoria dedicada y un requisito de TDP dedicado. Compite con las GPU de laserie GeForce MX de nivel portátil de Nvidia. Está dirigido a computadoras portátiles de productividad delgadas y altamente portátiles y tiene 4 GB de memoria LPDDR4X-4266 dedicada con un bus de memoria de 128 bits de ancho, tiene 96 EU, 48 unidades de textura, 24 ROP, una velocidad máxima de reloj de 1650 MHz y un rendimiento de 2,46 FP32 teraFLOPs con un TDP de 25w. En comparación, la GPU integrada en los procesadores Tiger Lake tiene un rendimiento de 2,1 FP32 teraFLOP.[36][37] El Xe MAX no reemplaza la GPU integrada del sistema; en cambio, fue diseñado para funcionar junto con él, por lo que las tareas se dividen entre las GPU integradas y discretas.[38] Inicialmente, solo estaba disponible en 3 computadoras portátiles: Asus VivoBook Flip 14 TP470, Acer Swift 3X y Dell Inspiron 15 7000. Las GPU Intel Xe MAX solo se pueden encontrar en sistemas con procesadores Tiger Lake.
Intel anunció oficialmente las tarjetas de escritorio Intel Iris Xe Graphics para OEM e integradores de sistemas el 26 de enero de 2021. Está dirigido a PC comerciales y de escritorio convencionales como una mejora con respecto a otras opciones de gráficos en decodificación de videoAV1, soporte de video HDR (alto rango dinámico) e inferencia de aprendizaje profundo, y no es tan poderoso como su contraparte decomputadora portátil, con solo 80 UE habilitados. Las primeras tarjetas están hechas por Asus, tienen salidasDisplayPort 1.4,HDMI 2.0, Dual Link DL-DVI-D y se enfrían pasivamente.[39][40][41][42]
Intel Arc es una serie de gráficos discretos de alto rendimiento optimizada para videojuegos. Esta compite directamente con las líneasGeForce deNvidia yRadeon deAMD. La primera generación (nombre en código "Alchemist") se desarrolló con el nombre "DG2" y se basa en la arquitectura Xe-HPG. Las generaciones futuras tienen el nombre en código Battlemage ("DG3", basado en Xe2), Celestial ("DG4", basado en Xe3 ) y Druid ("DG5").
Modelo[43] | Lanzamiento | MSRP (USD) | Nombre en clave | Proceso | Transistores (mil millones) | Tamaño del chip (mm2) | Config. del núcleo[a] | Caché L2 | Velocidad de reloj[b] (MHz) | Tasa de relleno | Memoria | Poder de procesamiento (TFLOPS) | TDP | Interfaz del bus | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Píxel (GP/s) | Textura (GT/s) | Tipo | Tamaño (GB) | Ancho de banda (GB/s) | Ancho del bus | Reloj (MT/s) | Media precisión (base) | Simple precisión (base) | Doble precisión (base) | ||||||||||||
Arc 3 | |||||||||||||||||||||
A310 | 28 de septiembre de 2022 | ACM-G11 | TSMC N6 | 7.2 | 157 | 768:32:16:6 (192:96:2:1) | 4 MB | 2000 2000 | 32 | 64 | GDDR6 | 4 GB | 124 | 64-bit | 15500 | 6.144 | 3.072 | 0.768 | 75 W | PCIe 4.0 x8 | |
A380 | 14 de junio de 2022 | $139 | 1024:64:32:8 (256:128:2:1) | 2000 2050 | 64 65.6 | 128 131.2 | 6 GB | 186 | 96-bit | 8.192 8.3968 | 4.096 4.1984 | 1.024 1.0496 | |||||||||
Arc 5 | |||||||||||||||||||||
A580 | Q4 2022 | ACM-G10 | TSMC N6 | 21.7 | 406 | 3072:192:96:24 (768:384:6:1) | 8 MB | 1700 1700 | 163.2 | 326.4 | GDDR6 | 8 GB | 512 | 256-bit | 16000 | 20.890 | 10.445 | 2.611 | 175 W | PCIe 4.0 x16 | |
Arc 7 | |||||||||||||||||||||
A750 | 14 de octubre de 2022 | $289 | ACM-G10 | TSMC N6 | 21.7 | 406 | 3584:192:112:28 (887:448:7:1) | 12 MB | 2050 2400 | 229.6 268.8 | 393.6 460.8 | GDDR6 | 8 GB | 512 | 256-bit | 16000 | 29.3888 34.4064 | 14.6944 17.2032 | 3.6736 4.3008 | 225 W | PCIe 4.0 x16 |
A770 8GB | $329 | 4096:256:128:32 (1024:512:8:1) | 16 MB | 2100 2400 | 268.8 307.2 | 537.6 614.4 | 34.4064 39.3216 | 17.2032 19.6608 | 4.3008 4.9152 | ||||||||||||
A770 16GB | $349 | 16 GB | 560 | 17500 |
Modelo[44] | Lanzamiento | Nombre en clave | Proceso | Transistores (mil millones) | Tamaño del chip (mm2) | Config. del núcleo[a] | Caché L2 | Velocidad de reloj[b] (MHz) | Tasa de relleno[c][d] | Memoria | Poder de procesamiento (TFLOPS) | TDP | Interfaz del bus | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Píxel (GP/s) | Textura (GT/s) | Tipo | Tamaño | Ancho de banda (GB/s) | Ancho del bus | Reloj (MT/s) | Media precisión (base) | Simple precisión (base) | Doble precisión (base) | |||||||||||
Arc 3 | ||||||||||||||||||||
A350M | 30 de marzo de 2022 | DG2-128 (ACM-G11) | TSMC N6 | 7.2 | 157 | 768:48:24:6 (96:96:2) | 4 MB | 1150 2200 | 27.6 52.8 | 55.2 105.6 | GDDR6 | 4 GB | 112 | 64-bit | 14000 | 3.5328 6.7584 | 1.7664 3.3792 | 0.4416 0.8448 | 25-35 W | PCIe 4.0 ×8 |
A370M | 1024:64:32:8 (128:128:2) | 1550 2050 | 49.6 65.6 | 99.2 131.2 | 6.3488 8.3968 | 3.1744 4.1984 | 0.7936 1.0496 | 35-50 W | ||||||||||||
Arc 5 | ||||||||||||||||||||
A550M | Q2 2022 | DG2-512 (ACM-G10) | TSMC N6 | 21.7 | 406 | 2048:128:64:16 (256:256:4) | 8 MB | 900 1700 | 57.6 108.8 | 115.2 217.6 | GDDR6 | 8 GB | 224 | 128-bit | 14000 | 7.3728 13.9264 | 3.6864 6.9632 | 0.9216 1.7408 | 60-80 W | PCIe 4.0 ×16 |
Arc 7 | ||||||||||||||||||||
A730M | Q2 2022 | DG2-512 (ACM-G10) | TSMC N6 | 21.7 | 406 | 3072:192:96:24 (384:384:6) | 12 MB | 1100 2050 | 105.6 196.8 | 211.2 393.6 | GDDR6 | 12 GB | 336 | 192-bit | 14000 | 13.5168 25.1904 | 6.7584 12.5952 | 1.6896 3.1488 | 80-120 W | PCIe 4.0 ×16 |
A770M | 4096:256:128:32 (512:512:8) | 16 MB | 1650 2050 | 211.2 262.4 | 422.4 524.8 | 16 GB | 512 | 256-bit | 16000 | 27.0336 33.5872 | 13.5168 16.7936 | 3.3792 4.1984 | 120-150 W |
Modelo[45] | Lanzamiento | Nombre en clave | Proceso | Transistores (mil millones) | Tamaño del chip (mm2) | Config. del núcleo[a] | Caché L2 | Velocidad de reloj[b] (MHz) | Tasa de relleno[c][d] | Memoria | Poder de procesamiento (TFLOPS) | TDP | Interfaz del bus | |||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Píxel (GP/s) | Textura (GT/s) | Tipo | Tamaño | Ancho de banda (GB/s) | Ancho del bus | Reloj (MT/s) | Media precisión (base) | Simple precisión (base) | Doble precisión (base) | |||||||||||
Arc Pro | ||||||||||||||||||||
A30M | 8 de agosto de 2022 | DG2-128 (ACM-G11) | TSMC N6 | 7.2 | 157 | 1024:64:16:8 (128:128:2) | 1 MB | 1500 2000 | 24 32 | 96 192 | GDDR6 | 4 GB | 112 | 64-bit | 14000 | ? | 0.525 3.500[45] | ? | 50 W | PCIe 4.0 x8 |
A40 | 6 GB | 192 | 96-bit | 16000 | ||||||||||||||||
A50 | 0.720 4.800[45] | 75 W |
Intel anunció oficialmente su GPUHPC /AI general Xe con nombre en códigoPonte Vecchio el 17 de noviembre de 2019. Se reveló que usaba la variante Xe-HPC de la arquitectura[46] y el 'Puente de interconexión de matriz múltiple integrado' (EMIB) de Intel y el paquete de apilamiento de matriz Foveros en un nodoIntel 4 (anteriormente denominado 7 nm). Intel confirmó más tarde en el Día de la Arquitectura 2021 que Ponte Vecchio usaría Compute Tiles fabricados en TSMC N5, Base Tiles y Rambo Cache Tiles fabricados conIntel 7 (anteriormente denominado 10 nm Enhanced SuperFin) y Xe Link Tiles fabricados en el proceso TSMC N7. Se espera que la nueva GPU se utilice en la nuevasupercomputadora a exaescala delLaboratorio Nacional de Argonne, Aurora, con nodos de cómputo que comprenden dos CPUIntel Xeon de próxima generación (nombre en código "Sapphire Rapids") y seis GPUPonte Vecchio.[47][48]