Construindo uma rede óptica flexível para clusters de potência de computação de IA

Apr 08, 2026

Deixe um recado

Roteamento fisicamente resiliente baseado em Shuffle determinístico

À medida que os clusters de IA continuam a crescer e os data centers se expandem em ritmo acelerado, a arquitetura de rede naturalmente foi além dos designs tradicionais. As topologias Leaf-Spine e Dragonfly estão se tornando a norma. No papel, parecem eficientes e modernos. Na prática, porém, as equipes de operações muitas vezes enfrentam uma realidade diferente-o que realmente causa problemas não é a topologia em si, mas o grande volume de patch cords. Quando você estiver lidando com milhares de conexões, o gerenciamento rapidamente se tornará complicado. E quando um único ponto falha, pode derrubar um link inteiro. Esse tipo de risco é difícil de ignorar.

 

É aqui que a ideia por trás do Infinity Shuffle OXC começa a fazer sentido. Em vez de seguir o modelo convencional de ponto-a{2}}ponto-, onde um único caminho carrega tudo,-ele separa canais de alta-velocidade e os distribui por vários caminhos do Spine na camada física. Em termos simples, evita colocar todos os ovos na mesma cesta. Quando ocorre uma falha, o sistema não entra em colapso total; simplesmente funciona com uma capacidade ligeiramente reduzida e os serviços continuam a funcionar.

 

Tome uma conexão 1.6T como exemplo. Ele é dividido em oito canais 200G independentes, cada um roteado por um caminho diferente. Se um módulo ou fibra falhar, apenas uma fração da largura de banda-cerca de 12,5%-será afetada. Para cargas de trabalho de treinamento de IA, esse tipo de degradação geralmente é administrável. Uma ligeira desaceleração é preferível a uma interrupção completa.

 

Do ponto de vista operacional, isso também altera o ritmo da manutenção. Componentes defeituosos não necessitam mais de intervenção urgente durante a noite. Eles podem ser tratados durante janelas de manutenção programadas, o que é muito mais sustentável em ambientes-de grande escala. Ao mesmo tempo, a redução dos módulos ópticos simplifica o sistema geral, melhorando a estabilidade em vez de complicá-lo. De muitas maneiras, essa abordagem distribuída parece mais próxima da lógica-de engenharia do mundo real do que da perfeição teórica.

 

Na camada física, a solução usa um design shuffle de fibra pré-{0}}terminado e de alta{1}}densidade, mantendo a perda de inserção tão baixa quanto aproximadamente 0,05 dB. Ele foi projetado para suportar redes 400G, 800G e 1.6T com orçamento óptico suficiente, enquanto mantém a inclinação e o isolamento do canal de acordo com os padrões IEEE 802.3. Não há nada de muito chamativo nisso-mas é prático, consistente e construído para resistir em escala.

 

Quatro dimensões principais projetadas para requisitos de IA em hiperescala

1. Integração perfeita de ecossistemas e topologias de implantação flexíveis

640 640 1

O Infinity Shuffle OXC se integra diretamente aos quadros de distribuição da série GPX (GPX51, GPX58, GPX59, GPX61, GPX62, GPX70) sem a necessidade de caixas adaptadoras de terceiros. Ele oferece suporte nativo a conectores MPO/MTP®, MMC, SN{8}}MT, bem como conectividade direta de fibra nua.

Duas topologias de implantação estão disponíveis:

Aleatório embutido: as conexões Spine entram pela parte traseira (normalmente alinhadas com os switches da coluna da parte superior-do-rack), enquanto as conexões Leaf saem pela frente. Essa configuração oferece suporte a designs baseados em cassete modular-e a formatos completos de painel 1RU/2RU. Ele permite uma separação clara entre corredores quentes/frios e garante roteamento determinístico de cabos traseiros-para{8}}dianteiros.

Embaralhamento-lado a-lado lado: Todas as conexões do switch Spine são consolidadas no lado esquerdo do chassi ou painel, enquanto as conexões do switch Leaf saem pela direita. Este layout é particularmente adequado para quadros de distribuição de fibra (FDFs) centralizados, onde o gerenciamento horizontal de cabos entre as zonas Spine e Leaf deve ser minimizado.

Ambas as topologias suportam conexões seriais de acesso traseiro e interconexões paralelas de acesso frontal, melhorando significativamente a utilização do espaço em rack e adaptando-se a diversas arquiteturas de cabeamento de data center.

 

2. Otimização de custos e mitigação de riscos

Do ponto de vista económico, a integração nos níveis 400G, 800G e 1.6T reduz o número de switches necessários de 24 para 8 e de módulos ópticos de 1280 para 320. Isto reduz diretamente o consumo de energia e as despesas de capital, com poupanças totais de custos que chegam até 40%.

Do ponto de vista do risco, os sistemas tradicionais de fibra agrupada introduzem pontos únicos de falha-por exemplo, danos a um único tronco MPO-16 podem resultar imediatamente na perda de um link completo de 1,6T. Por outro lado, a arquitetura Shuffle distribui a mesma capacidade de 1,6T por oito caminhos físicos independentes. Estatisticamente, as falhas são isoladas em canais individuais, limitando o impacto a 1/8 da largura de banda total. Os clusters de treinamento de IA podem continuar operando com aproximadamente 87,5% da capacidade, mantendo a conectividade RDMA, evitando eventos de reconvergência de rede em grande escala.

 

3. Fabricação de precisão-de nível industrial

Cada unidade OXC é produzida em linhas de fabricação automatizadas, incorporando corte de substrato (±0,5 mm), roteamento de fibra biônica (±0,1 mm) e distribuição de precisão (±0,5 mm).

O design de roteamento biônico garante isolamento físico rigoroso do canal-prevenindo interferência entre os oito canais de 200G em um link de 1,6T-enquanto mantém comprimentos de fibra iguais para eliminar distorção de sinal. Todas as unidades passam por validação óptica abrangente antes da entrega, eliminando o risco de erros de terminação de campo e evitando problemas de desequilíbrio de canal associados à sinalização PAM4 de alta-velocidade.

 

4. Conformidade com as Normas Internacionais

O Infinity Shuffle OXC está em conformidade com os principais padrões internacionais, incluindo Telcordia GR-63, GR-1435 (MPO), IEC 61300, IEC 61753-1 e IEC 61754-7/TIA-604-5.

O circuito óptico flexível utiliza um substrato de filme de poliimida com revestimento protetor conformal, suportando dimensões máximas de até 1000 mm × 800 mm. Um design de{3}camada única pode acomodar mais de 1.200 núcleos de fibra, atendendo aos requisitos de densidade de implantações em hiperescala.

 

5. Integridade do sinal multi-canal

O substrato suporta fibra de fita de 250 μm, fibra-de modo único de 200 μm (G657.A1/A2) e fibra de-próxima geração de 180 μm.

O desempenho óptico é rigorosamente controlado, com perda de inserção típica menor ou igual a 0,12 dB (UPC/APC de alta-qualidade), 97% de correspondência aleatória menor ou igual a 0,25 dB e perda de retorno maior ou igual a 65 dB (APC) e maior ou igual a 60 dB (UPC). Isso garante distribuição uniforme de perdas em todos os oito canais em um link 1.6T, atendendo aos requisitos de calibração KP4 FEC e mantendo a eficiência energética em escala.

Você não tem palavras humanizadoras suficientes. Atualize seu plano Surfer.

 

Alinhado com precisão com três cenários de aplicativos principais

640

1. Otimizando Leaf{1}}Spine com confiabilidade aprimorada da Spine

Em clusters de treinamento de IA, o Infinity Shuffle OXC permite roteamento cruzado-determinístico entre as camadas Spine e Leaf. Quando implantado em uma configuração serial Inline Shuffle-conexões Spine entrando pela parte traseira e conexões Leaf saindo pela frente-ele cria uma estrutura limpa de corredor quente/frio e um layout de cabeamento previsível.

Este design se alinha naturalmente com as arquiteturas enxutas do Spine. Um link 1.6T é distribuído fisicamente por oito switches Spine. Se um switch Spine,-por exemplo, Spine #3, exigir manutenção, apenas um único canal de 200G (12,5% da largura de banda total) será redirecionado via ECMP para um caminho equivalente. A capacidade restante continua a operar, permitindo que as cargas de trabalho de treinamento sustentem aproximadamente 1,4T de rendimento sem interrupções. A manutenção pode prosseguir sem afetar os serviços principais.

 

2. Simplificando topologias Dragonfly por meio da distribuição-de camadas físicas

Em ambientes de computação de alto-desempenho (HPC, na sigla em inglês) com dezenas de milhares de nós, as topologias de malha-completa Dragonfly tradicionais exigem cabeamento complexo intra-grupo. Com o Infinity Shuffle OXC, o embaralhamento óptico entre{4}grupos é concluído no nível de fábrica, reduzindo significativamente a-complexidade no local.

Quando implantadas em um quadro de distribuição de fibra centralizado usando uma topologia Shuffle paralela, as conexões Spine são consolidadas no lado esquerdo enquanto as conexões Leaf são roteadas a partir da direita. Isso cria uma separação física clara entre as camadas da rede. O roteamento determinístico garante que em um único link 1.6T, todos os oito canais 200G sigam caminhos físicos independentes-entre diferentes switches, fibras e conectores-eliminando efetivamente os riscos de falha correlacionados associados aos links de tronco agrupados.

 

3. Futuro-Pronto para 800G e além

À medida que a largura de banda da rede evolui para 1,6T e 3,2T (8 × 200G ou 8 × 400G), o valor de resiliência das arquiteturas Shuffle torna-se ainda mais pronunciado. Em uma implantação 3.2T distribuída entre switches Spine (16 × 200G), uma falha de canal único resulta em uma redução de largura de banda de apenas 6,25%.

Depois que a infraestrutura óptica Shuffle for implantada, as atualizações futuras exigirão apenas a substituição do módulo óptico, sem alterações na camada física. O substrato suporta nativamente fibras ultrafinas-de 180 μm de próxima{3}}geração, garantindo compatibilidade com todas as-tecnologias ópticas futuras. À medida que as-taxas de dados do canal aumentam-juntamente com o consumo de energia e a probabilidade de falha-essa arquitetura fornece uma base estável, absorvendo efetivamente o maior risco associado ao 800G e além, mantendo o serviço ininterrupto.

 

Da complexidade manual à confiabilidade determinística

O conceito de "Shuffle" não é uma questão de aleatoriedade. É uma distribuição determinística de canais de alta-velocidade em conexões Spine fisicamente independentes. As operações tradicionais dependem do gerenciamento manual de milhares de links de fibra,-uma abordagem ineficiente e propensa a erros-. Em contraste, esta arquitectura reestrutura a conectividade na camada física, melhorando tanto a clareza operacional como a fiabilidade do sistema.

Ao distribuir uniformemente oito canais de 200 G em oito switches Spine, o sistema garante que as falhas-sejam em módulos ópticos, fibras ou switches-permaneçam como eventos isolados, em vez de interrupções sistêmicas. Isso basicamente evita interrupções em grande-escala em redes ópticas-orientadas por IA.

 

Seja otimizando arquiteturas Leaf{0}}Spine com uma camada Spine mais enxuta, simplificando implantações Dragonfly por meio de cabeamento estruturado ou preparando-se para escalonamento futuro de 1,6T/3,2T com tolerância a falhas-integrada, o Infinity Shuffle OXC fornece uma base de cabeamento de alta-eficiência, alta-confiabilidade e custo{6}}econômico para data centers de hiperescala-garantindo que cargas de trabalho de computação permanecem ininterruptos por restrições de infraestrutura óptica.

 

Enviar inquérito