Se presenta la arquitectura Lunar Lake de Intel
11:30, 06.06.2024
Durante el Intel Tech Tour 2024, se presentó Lunar Lake y se desvelaron las principales modificaciones. Estos procesadores se diseñaron principalmente para portátiles, pero algunas de las mejoras pueden trasladarse a Arrow Lake y utilizarse en PC.
Para alcanzar el nivel deseado de rendimiento y potencia, la nueva arquitectura Lunar Lake ha sufrido importantes optimizaciones. Los cambios más significativos se han realizado en los núcleos Skymont y E. Los gráficos Xe2 integrados también han tenido un impacto considerable en el rendimiento del chip de vídeo.
Lunar Lake incorpora el último procesador neuronal, que tiene un rendimiento de 48 TOPS y puede utilizarse para IA. Si tenemos en cuenta el rendimiento global, es de 120 TOPS, y esto tendrá un impacto considerable en las capacidades de la inteligencia artificial.
Uno de los objetivos de la introducción de procesadores móviles de esta serie era garantizar la eficiencia energética. También está previsto utilizar esta arquitectura en los próximos proyectos de Intel (Panther Lake y Arrow Lake).
Para crear la mejor arquitectura posible, Intel utilizó el proceso N3B de TSMC. Esta elección afectó especialmente a las características de los núcleos de cálculo, las NPU y los gráficos integrados. En cuanto al controlador, la empresa decidió utilizar el proceso N6 de TSMC. Sólo las fichas 22FFL Foveros fueron desarrolladas por Intel.
Estructura del SoC Lunar Lake
La estructura de los procesadores Lunar Lake tendrá sus propias peculiaridades, como 4 núcleos E y 4 núcleos P. N6, TSMC N3B y un refuerzo se colocarán en la placa base. En el chip se colocarán dos pilas de memoria en configuraciones de 32 GB y 15 GB. El ancho de banda garantizado por chip será de hasta 8,5 GT/s.
El mosaico de cálculo constará de NPU 4.0, chips Xe2 y núcleos principales. Para aumentar la frecuencia de las llamadas, el tile dispondrá de 8 MB de «caché lateral», que a su vez utilizarán conjuntamente los bloques de cálculo.
Núcleos de bajo consumo
Se han logrado avances significativos con Skymont y mejoras relativas al kernel Lion Cove. Más concretamente, se producirá un aumento del 68% en el IPC para el trabajo con coma flotante y del 38% para las cargas de trabajo con enteros. En este caso, el rendimiento de las tareas multihilo aumentará casi 4 veces, y hasta 2 veces en las tareas de un solo hilo.
La empresa también prevé cambios positivos en el rendimiento vectorial, que serán posibles gracias al cambio de dos canales vectoriales de 128 bits a cuatro. También habrá cambios para minimizar la latencia.
Los anteriores núcleos de bajo consumo tenían una caché de 2 MB, y ahora esta cifra se ha incrementado significativamente hasta los 4 MB.
Núcleos de rendimiento
Un movimiento inesperado realizado por la compañía fue la eliminación de Hyperthreading, que proporcionaba un aumento medio del IPC del 14 por ciento. Se descubrió que Hyperthreading, que tiene un efecto positivo en el aumento del IPC en una carga de trabajo multihilo, no es muy útil en un diseño híbrido. Intel informa de que, dependiendo de la potencia del chip, el rendimiento global es del 10-18%.
Con la eliminación de Hyperthreading, el núcleo se ha hecho más pequeño, y ahora es posible realizar otros cambios, como aumentar los núcleos de la GPU o los núcleos E. Gracias a este importante paso, la compañía ha conseguido aumentar la eficiencia en un 15% y el rendimiento en un 10%.
En comparación con la arquitectura anterior, la unidad de predicción se ha ampliado 8 veces. Además, se ha triplicado el ancho de banda de caché a L2 y se ha duplicado el ancho de banda de obtención de instrucciones. En cuanto a las microoperaciones, su cola se ha incrementado hasta 192.
Gráficos Intel Xe2
El procesador gráfico Xe2 tendrá un rendimiento significativamente diferente antes del uso de la inteligencia artificial y tendrá un aumento general del rendimiento de una vez y media. Además de los nuevos procesadores Lunar Lake, Xe2 también estará disponible en tarjetas gráficas para juegos.
El núcleo de segunda generación de la arquitectura Xe se caracteriza por un aumento de la caché, compatibilidad con determinados tipos de datos y modificaciones en los mecanismos vectoriales. El procesador gráfico consta de elementos con funciones fijas y de visualización que afectan significativamente a las texturas y la geometría.
El motor vectorial admite las siguientes instrucciones BF16, INT4, INT2, FP16, necesarias para operaciones relacionadas con la inteligencia artificial. La unidad de visualización también ha visto un número significativo de mejoras y aceleraciones.
El chip de vídeo Lunar Lake cuenta con 8 unidades de trazado de rayos, 64 motores vectoriales, 2 núcleos Xe y muchos otros componentes.
Controlador y NPU 4.0
La NPU ha superado con creces las características de los competidores. Se necesita un chip separado principalmente para las tareas de IA, así como para ahorrar batería. El rendimiento global de Lunar Lake es de 120 TOPS.
En general, ha habido un número significativo de mejoras en la arquitectura, incluidos los mecanismos DMA y MAC, 6 mecanismos de computación neuronal, y mucho más. En comparación con la generación anterior de NPU, el rendimiento ha aumentado considerablemente.
El mosaico de controladores incluye todas las funciones de E/S, así como los controladores de memoria. La empresa afirma que los portátiles Lunar Lake tendrán al menos 2 puertos de conectividad.