Los centros de datos tienen un problema de rendimiento. Amazon dice tener la solución

Amazon ha anunciado que ha conseguido un importante avance en el diseño de redes para sus centros de datos, y que desde finales del año pasado ya está desplegando la nueva tecnología de forma discreta. Según la compañía, el nuevo esquema ha incrementado de manera significativa la velocidad de transmisión de datos y ha reducido el consumo energético, lo que le otorga una ventaja competitiva en la carrera por crear infraestructuras en la nube cada vez más rápidas y eficientes.

El núcleo de esta innovación es un diseño “cuasialeatorio” que combina elementos de las redes estructuradas tradicionales con las ventajas de rendimiento propias de arquitecturas aleatorias. Aunque los investigadores llevan décadas estudiando redes aleatorias, hasta ahora no se había logrado una implementación práctica a gran escala.

Detalles del nuevo enfoque “RNG”

El equipo de ingenieros e investigadores de Amazon Web Services (AWS), que incluye a varios profesionales provenientes del ámbito académico, comenzó a trabajar en el problema de las redes aleatorias en 2023. Como parte del proyecto, Amazon desarrolló un dispositivo llamado ShuffleBox, que reorganiza automáticamente los cables necesarios para este tipo de topología.

“El hecho de que Amazon esté usando esto en producción es extraordinario”, comentó Brighten Godfrey, profesor de informática en la Universidad de Illinois en Urbana‑Champaign y experto en redes, quien no participó en la investigación de Amazon. Godfrey fue coautor de un artículo fundamental de 2012 sobre grafos de redes aleatorias, los cuales describió como “un problema complejo de resolver en general”.

Matt Rehder, vicepresidente de Ingeniería de Redes de AWS, explicó en una entrevista exclusiva con WIRED: “Al aplanar la red, eliminamos los cuellos de botella de los diseños tradicionales. Creemos que somos los únicos que hemos conseguido hacerlo a escala”.

El documento público publicado el mes pasado, titulado RNG: Flat Datacenter Networks at Scale, describe la arquitectura como basada en “resilient network graphs” (RNG, grafos de red resilientes), que no son ni totalmente estructurados ni totalmente aleatorios. A diferencia de otras iniciativas, el proyecto no depende de la IA generativa; su objetivo es optimizar la propia arquitectura de los centros de datos.

Puntos Clave
  • Amazon ha puesto en producción una arquitectura de red “cuasialeatoria” (RNG) que combina lo mejor de las topologías estructuradas y aleatorias
  • Esta nueva topología ha incrementado notablemente la velocidad de transmisión de datos y ha reducido el consumo energético de los centros de datos
  • Para implementarla, AWS desarrolló el dispositivo ShuffleBox, que reorganiza automáticamente los cables según el esquema cuasialeatorio
  • AWS asegura ser el único que ha logrado escalar esta solución, obteniendo una ventaja competitiva en la creación de infraestructuras en la nube más rápidas y eficientes

Desde la década de los ochenta, la mayoría de las redes de centros de datos se han construido sobre la topología de “fat‑tree”, con dos o tres capas verticales de conmutadores y enrutadores y enlaces anchos en la parte superior para evitar cuellos de botella. Si bien esta arquitectura es fiable, resulta rígida, ineficiente y requiere un cableado extenso y costoso.

Rehder señaló que el cableado representa uno de los mayores costos operativos. Actualmente, los centros de datos de Amazon están interconectados mediante aproximadamente 20 millones de kilómetros de fibra óptica, una distancia comparable a viajar de la Tierra a la Luna y volver 25 veces.

En 2012, un grupo de investigadores de la Universidad de Illinois, entre ellos Godfrey, presentó el concepto “Jellyfish”, una topología de grafo aleatorio que buscaba superar las limitaciones de los diseños fijos de la época. Aunque Jellyfish mostró potencial, también introdujo desafíos en enrutamiento y cableado. Google, por su parte, experimentó con conmutación óptica de circuitos (OCS), que permite reconfigurar el cableado en tiempo real pero con mayor complejidad y coste.

El objetivo de Amazon, según Giacomo Bernardi, uno de los autores principales del artículo junto a Ratul Mahajan y Seshhri Comandur, era crear una red “plana, eficiente, resistente a fallos y escalable”. Inicialmente se inspiraron en los teseles de Penrose, pero tras constatar que la simulación no ofrecía los resultados esperados, optaron por un enfoque cuasi‑aleatorio que aceptara el caos estructural.

El ShuffleBox es el dispositivo óptico que permite mezclar internamente las conexiones entre los routers, reduciendo la complejidad del cableado tradicional. Durante una visita a los laboratorios de redes de Amazon en Cupertino, WIRED observó la diferencia entre los enredos típicos de una topología de árbol y las ondas ordenadas que atraviesan el ShuffleBox en el nuevo diseño.

Según los datos internos de la compañía, los resultados son contundentes:

  • Un 69 % menos de routers y conmutadores.
  • Un 33 % de aumento en el rendimiento de datos.
  • Una reducción del 40 % en el consumo energético de la red.
  • Una disminución del 27 % en los costos operativos.

La primera implementación de la arquitectura RNG tuvo lugar en un centro de datos de Dublín en 2024. Posteriormente, la tecnología se extendió a instalaciones en Alemania y España, y hoy la mayoría de los nuevos centros de datos de Amazon incorporan el protocolo RNG como estándar.

Javier Mendoza Silva
Javier Mendoza Silva Periodista

Licenciado en Comunicación Social con mención en Periodismo por la Universidad Central de Venezuela. Tiene 12 años de experiencia en cobertura de política nacional y conflictos sociales, con enfoque en derechos humanos. Ha trabajado para medios impresos, digitales y radiofónicos en Latinoamérica.

Vota post
Mira tambien:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir