"Al aplanar la red, eliminamos los cuellos de botella de los diseños de red tradicionales. Creemos que somos los únicos que hemos hecho esto a escala", declaró Matt Rehder, vicepresidente de Ingeniería de Redes de AWS, en una entrevista exclusiva con WIRED.
documento publicado el mes pasado titulado RNG: Flat Datacenter Networks at Scale. RNG son las siglas de 'resilient network graphs' (redes resilientes), que no son ni totalmente estructuradas ni totalmente aleatorias.Curiosamente, el equipo de Amazon responsable de RNG no está basando su propuesta de redes en la IA generativa. Se trata de optimizar la arquitectura de los centros de datos de la compañía. "RNG se adapta perfectamente a nuestras necesidades principales, pero los patrones de datos de entrenamiento de IA están mucho más coordinados y centralizados, por lo que no se asemejan a un grafo aleatorio", afirma Rehder.
Desde mediados de la década de los ochenta, las redes de comunicaciones, desde telecomunicaciones hasta centros de datos, se han diseñado con una topología de 'fat-tree' (árbol gordo), que incluye dos o tres capas verticales de conmutadores y enrutadores. Estos se conectan mediante nodos "anchos" en la parte superior de la estructura, donde hay múltiples enrutadores del mismo tipo, y ramas más delgadas hacia la parte inferior. En pocas palabras, en una red de árbol gordo, los datos se mueven hacia arriba y hacia abajo en la pila. El mayor ancho de banda cerca de la parte superior de la estructura, donde los datos se dividen, ayuda a eliminar los cuellos de botella.
los centros de datos globales de Amazon están conectados actualmente con 20 millones de kilómetros de cables de fibra óptica. Esa es aproximadamente la distancia que habría que recorrer para viajar de la Tierra a la Luna y volver 25 veces.En 2012, cuando la demanda de servicios de computación en la nube se disparaba, un grupo de investigadores de la Universidad de Illinois Urbana-Champaign, entre ellos Godfrey, presentó un concepto conocido como Jellyfish. Los diseños de red fijos que se utilizaban en ese momento tenían dificultades para satisfacer la creciente demanda, por lo que los investigadores propusieron una "interconexión de red de alta capacidad que, al adoptar una topología de grafo aleatorio, se adapta naturalmente a la expansión incremental". Creían que este enfoque aleatorio podría ser más eficiente y escalable que las redes construidas con la arquitectura de árbol gordo.
"Le pusimos el nombre de Jellyfish porque es flexible como una medusa. Puedes conectar los enrutadores y conmutadores de forma aleatoria y se convierte en un conjunto flexible de capacidad de red, lo cual es muy eficiente", argumenta Godfrey.
Sin embargo, Jellyfish también introdujo nuevos desafíos en el diseño, el enrutamiento de datos y el cableado. "El enrutamiento en grafos aleatorios es más complejo, porque existen muchas más rutas, y más diversas, que los datos pueden seguir desde su origen hasta su destino. El cableado es más difícil porque los extremos de los cables se eligen aleatoriamente", explica Godfrey.
Un par de años después, Google empezó a experimentar con otra solución: integró la conmutación de circuitos ópticos (OCS) en el diseño de sus redes. Este método utiliza pequeños espejos para reflejar la luz desde un puerto de entrada a uno de salida, lo que permite a Google reconfigurar el cableado óptico en tiempo real. Sin embargo, esto también implica cierta complejidad técnica y un costo mayor.
computadoras cuánticas. Bernardi se preguntó si Amazon podría usar una construcción similar y crear una "malla" plana siguiendo un patrón repetitivo. Él y su equipo intentaron crear una simulación de cómo se vería.los centros de datos de la compañía sean más eficientes y resistentes. En comparación con las redes tradicionales, asegura que utiliza un 69% menos de enrutadores y conmutadores, ofrece un rendimiento de datos un 33% superior, reduce el consumo de energía de la red en un 40% y disminuye los costos operativos en un 27%.La primera implementación de RNG tuvo lugar en un centro de datos de Dublín en 2024. Posteriormente, Amazon extendió esta tecnología a centros de datos en Alemania y España. Actualmente, según datos internos de la compañía, la mayoría de los nuevos centros de datos ya incorporan el protocolo de red RNG.
Artículo originalmente publicado en