La gama “Xeon Scalable” de Intel está diseñada para competir directamente con la plataforma Naples de AMD. Naples, es una plataforma de servidor de alto rendimiento que se basa en la vinculación de múltiples núcleos a través de AMD Infinity Fabric Interconnect. Este nuevo procesador de AMD ha dado a Intel algunos desafíos en términos de cómo estructurar su propia familia de alto número de núcleo y ha llevado a Intel a la creación de una nueva tecnología de interconexión basada en mallas.
Para vincular múltiples núcleos juntos, Intel tradicionalmente se basó en su Interconexión QPI (Quick Path Interconnect), pero tiene sus propias limitaciones. Para empezar, QPI es una tecnología punto a punto, y es intrínsecamente inadecuado para vincular núcleos entre sí en una topología de malla como se necesita cuando núcleos aleatorios quieren dirigirse entre sí. Para trabajar, tendrías que crear un enlace QPI de cada núcleo a cada otro núcleo de la CPU, y eso sería un desperdicio de recursos.
Históricamente, para solucionar ese problema Intel ha utilizado un “Ring bus” bidireccional, básicamente, cuando se transmiten datos, se debe pasar alrededor del bus. Cada ciclo de reloj, el bus puede cambiar datos de una manera u otra, pero si quieres ir de un núcleo a otro más alejado posible, la latencia sufre, lo que viene a ser inviable para procesadores de alto número de núcleos.
 
Introducción la interconexión de malla:
Técnicamente, esta nueva tecnología Mesh Interconnect de Intel fue introducida con los procesadores Xeon Phi Knight’s Landing, pero son CPUs bastante exclusivas. Ahora, en las implementaciones de chips más simples, cada núcleo tiene una conexión directa a cada chip vecino, una topología de malla completa con todos sus beneficios. En CPUs más complejas, la esta conexión directa vuelve a ser antieconómica, ya que requeriría una gran cantidad de recursos para que cualquier fabricante de chips implementara CPUs profesional como Naples y Xeon Scalable. En su lugar volveremos a una topología de malla más simple, filas y columnas.
 

 
Básicamente, es una cuadrícula con un sistema de enrutamiento XY completo, esto significa que en vez de circular alrededor de un enorme círculo en forma de bus, pueden pasar por una topología “cúbica” mucho más compacta y ahorrar tiempo. En un simple ejemplo de cubo de 3×3, mientras que se necesitaría un total de 8 ciclos de reloj en un ringbus equivalente para que las comunicaciones alcanzaran el núcleo más alejado, lo máximo que puede tomar un núcleo basado en interconexión de malla es 4.

La conclusión es que Intel tiene una interconexión que puede competir con el tejido de Infinity de AMD. La interconexión de malla está programada para debutar en los mercados entusiastas Xeon Scalable y Skylake-X.