Intel anuncia el procesador acelerado de IA y HPC «Rialto Bridge»

Intel anuncia el procesador acelerado de IA y HPC «Rialto Bridge»
Durante la Conferencia Internacional de Supercomputación en Hamburgo, Alemania, Jeff McVeigh, vicepresidente y gerente general del Super Compute Group de Intel Corporation, anunció Rialto Bridge, la unidad de procesamiento de gráficos (GPU) del centro de datos de Intel. Utilizando la misma arquitectura que la GPU Ponte Vecchio del centro de datos de Intel y combinando mosaicos mejorados con el próximo nodo de proceso de Intel, Rialto Bridge ofrecerá hasta 160 núcleos Xe, más FLOP, más ancho de banda de E/S y límites de TDP más altos para aumentar significativamente la densidad y el rendimiento. y eficiencia.
“A medida que nos embarcamos en la era de la exaescala y corremos hacia la escala zetta, la contribución de la industria tecnológica a las emisiones globales de carbono también está creciendo. Se ha estimado que para 2030, entre el 3 % y el 7 %1 de la producción mundial de energía será consumida por los centros de datos. , siendo la infraestructura informática uno de los principales impulsores del nuevo uso de la electricidad», dijo Jeff McVeigh, vicepresidente y director general del Super Compute Group de Intel Corporation.
Este año, Intel se comprometió a lograr cero emisiones netas de gases de efecto invernadero en nuestras operaciones globales para 2040 y a desarrollar soluciones tecnológicas más sostenibles. Mantenerse al día con las demandas insaciables de computación mientras se crea un futuro sostenible es uno de los mayores desafíos para la computación de alto rendimiento (HPC). Si bien es desalentador, se puede lograr si abordamos cada parte de la pila de cómputo de HPC: silicio, software y sistemas.
Comience con silicio y arquitectura de computación heterogénea
Tenemos una hoja de ruta de HPC agresiva planificada hasta 2024 que ofrecerá una cartera diversa de arquitecturas heterogéneas. Estas arquitecturas nos permitirán mejorar el rendimiento en órdenes de magnitud al tiempo que reducen las demandas de energía en cargas de trabajo emergentes y de propósito general, como IA, encriptación y análisis.
El procesador Intel Xeon con nombre en código Sapphire Rapids con memoria de alto ancho de banda (HBM) es un gran ejemplo de cómo estamos aprovechando las tecnologías de empaquetado avanzadas y las innovaciones de silicio para brindar mejoras sustanciales de rendimiento, ancho de banda y ahorro de energía para HPC. Con hasta 64 gigabytes de memoria HBM2E de gran ancho de banda en el paquete y aceleradores integrados en la CPU, podemos liberar las cargas de trabajo limitadas por el ancho de banda de la memoria y, al mismo tiempo, ofrecer mejoras de rendimiento significativas en los casos de uso clave de HPC. Al comparar los procesadores escalables Intel Xeon de tercera generación con los próximos procesadores Sapphire Rapids HBM, observamos aumentos de rendimiento de dos a tres veces en las cargas de trabajo de investigación meteorológica, energía, fabricación y física. En el discurso de apertura.
La densidad de cómputo es otro imperativo a medida que impulsamos ganancias de rendimiento de órdenes de magnitud en las cargas de trabajo de supercomputación de HPC e IA. Nuestra primera unidad de procesamiento de gráficos (GPU) para centros de datos de Intel, cuyo nombre en código es Ponte Vecchio, ya está superando a la competencia en aplicaciones de servicios financieros complejos y cargas de trabajo de entrenamiento e inferencia de IA. También mostramos que Ponte Vecchio está acelerando la simulación de alta fidelidad por 2 veces con OpenMC.
No nos detendremos aquí. Hoy anunciamos nuestro sucesor de esta potente GPU para centros de datos, cuyo nombre en código es Rialto Bridge. Al evolucionar la arquitectura Ponte Vecchio y combinar mosaicos mejorados con la próxima tecnología de nodo de proceso, Rialto Bridge ofrecerá densidad, rendimiento y eficiencia significativamente mayores, al tiempo que brindará consistencia de software.
De cara al futuro, Falcon Shores es la próxima gran innovación de arquitectura en nuestra hoja de ruta, ya que reúne las arquitecturas de CPU x86 y GPU Xe en un solo socket. Esta arquitectura está prevista para 2024 y se prevé que brinde beneficios de más de 5 veces el rendimiento por vatio, 5 veces la densidad de cómputo, 5 veces la capacidad de memoria y mejoras en el ancho de banda.
Principios de una estrategia de software exitosa: apertura, elección, confianza El silicio es solo arena sin software para darle vida. Nuestro enfoque del software es facilitar el desarrollo abierto en toda la pila y proporcionar herramientas, plataformas y software IP para ayudar a los desarrolladores a ser más productivos y producir código escalable, de mejor rendimiento y más eficiente que pueda aprovechar las últimas innovaciones de silicio sin la carga de refactorizar el código. La iniciativa de la industria oneAPI proporciona a los desarrolladores de HPC programación entre arquitecturas para que el código pueda dirigirse a CPU, GPU y otros aceleradores especializados de forma transparente y portátil.
Ahora hay más de 20 Centros de Excelencia oneAPI en instituciones académicas y de investigación líderes en todo el mundo, y están logrando un progreso significativo. Por ejemplo, Simon MacIntosh-Smith y su equipo del Departamento de Ciencias de la Universidad de Bristol están desarrollando las mejores prácticas para lograr la portabilidad del rendimiento a gran escala utilizando oneAPI y la capa de abstracción SYCL de Khronos Group para la programación entre arquitecturas. Su trabajo garantizará que el código científico pueda lograr un alto rendimiento en sistemas de supercomputación heterogéneos masivos en todo el mundo.
Atándolo todo: sistemas para computación heterogénea sostenible A medida que las cargas de trabajo del centro de datos y HPC se mueven cada vez más hacia arquitecturas desagregadas y computación heterogénea, necesitaremos herramientas que puedan ayudarnos a administrar de manera efectiva estos entornos informáticos complejos y diversos.
Hoy, presentamos Intel XPU Manager, una solución de código abierto para monitorear y administrar las GPU del centro de datos de Intel de forma local y remota. Fue diseñado para simplificar la administración, maximizar la confiabilidad y el tiempo de actividad mediante la ejecución de diagnósticos integrales, mejorar la utilización y realizar actualizaciones de firmware.
Un sistema de archivos Distributed Asynchronous Object Storage (DAOS) proporciona optimizaciones a nivel de sistema para las tareas de movimiento y almacenamiento de datos que consumen mucha energía. DAOS tiene un impacto enorme en el rendimiento del sistema de archivos, ya que mejora el tiempo de acceso general y reduce la capacidad requerida para el almacenamiento para reducir el espacio del centro de datos y aumentar la eficiencia energética. En los resultados de I/O 500 en relación con Lustre, DAOS logró un aumento de 70 veces en el rendimiento del sistema de archivos de escritura dura.
Abordar el desafío de la sostenibilidad de HPC Estamos orgullosos de asociarnos con clientes de ideas afines e instituciones de investigación líderes en todo el mundo para lograr una HPC más sostenible y abierta. Los ejemplos recientes incluyen nuestra asociación con el Centro de Supercomputación de Barcelona para establecer un laboratorio RISC-V zettascale pionero, y nuestra colaboración continua con la Universidad de Cambridge y Dell para convertir el Exascale Lab actual en el nuevo Cambridge Zettascale Lab. Estos esfuerzos se basan en nuestros planes para crear un sólido ecosistema de innovación en la UE para el futuro de la computación.
La conclusión es que ninguna empresa puede hacerlo sola. Todo el ecosistema necesita apoyarse igualmente, a través de la fabricación, el silicio, la interconexión, el software y los sistemas. Al hacer esto juntos, podemos convertir uno de los mayores desafíos de HPC del siglo en la oportunidad del siglo y cambiar el mundo para las generaciones futuras.
Fuente: Intel