A equipe de Elon Musk na xAI realizou um feito notável ao montar um supercluster de 100.000 GPUs H200 Blackwell em apenas 19 dias. Jensen Huang, CEO da Nvidia, destacou essa proeza em um encontro com membros do Tesla Owners Silicon Valley.
Huang elogiou o trabalho de Musk e sua equipe, descrevendo o esforço de 19 dias como “sobre-humano”. Esse foi o tempo necessário para que a equipe da xAI passasse da fase de “conceito” para a completa compatibilidade com os equipamentos da Nvidia, culminando na primeira execução de treinamento de IA no supercluster recém-construído.
Via Not a Tesla APP
Um supercluster de 100.000 GPUs é um sistema de computação massivamente paralelo composto por 100.000 unidades de processamento gráfico (GPUs) interconectadas, projetado para realizar tarefas de computação de alto desempenho.
As GPUs, originalmente criadas para renderização gráfica, são extremamente eficientes em processar grandes quantidades de dados simultaneamente.
Dessa forma, são ideais para aplicações de aprendizado profundo (deep learning), inteligência artificial (IA), simulações científicas, modelagem climática, e outras tarefas que demandam processamento massivo.
Nesse contexto, um supercluster desse porte é capaz de processar dados em uma escala gigantesca, resolvendo problemas complexos de IA e simulação que seriam impraticáveis com CPUs tradicionais.
Todas essas GPUs se interligam por redes de alta velocidade e baixa latência, permitindo que trabalhem em conjunto como uma única entidade computacional. Isso exige uma infraestrutura de rede avançada para coordenar o fluxo de dados entre as GPUs.
Por outro lado, um supercluster dessa magnitude consome enormes quantidades de energia e gera muito calor. Assim, exige sistemas avançados de resfriamento, como o resfriamento líquido, para evitar superaquecimento e garantir eficiência.
Mesmo com esses apontamentos, esse equipamento pode treinar modelos de IA muito maiores e mais complexos, permitindo avanços em áreas como visão computacional, processamento de linguagem natural, biotecnologia, descoberta de medicamentos, entre outros.
Por isso a equipe de Elon Musk impressionou com sua infraestrutura de computação extremamente poderosa. Esse projeto pode realizar operações computacionais em uma escala e velocidade impressionantes.
O processo envolveu desde a construção da imensa fábrica do X, onde as GPUs estão instaladas, até a montagem completa, com sistemas de resfriamento líquido e fornecimento de energia para operar as 200.000 GPUs.
Além disso, houve uma complexa coordenação entre as equipes de engenharia da Nvidia e de Elon Musk, garantindo a entrega e instalação precisa de todo o hardware e infraestrutura.
Para contextualizar, Huang afirmou que outras equipes em centros de processamento de dados levariam, em média, quatro anos para realizar o que Musk e sua equipe fizeram em 19 dias.
Três desses anos seriam para o planejamento, enquanto o último ano seria para enviar o equipamento, realizar a instação e colocar em funcionamento.
Via Freepik
De acordo com o CEO da Nvidia, a integração de um supercluster 100.000 GPUs H200 que a equipe de Elon Musk realizou “nunca foi feita antes”. Além disso, provavelmente não será replicada por outra empresa tão cedo.
Isso porque ele explicou a complexidade da rede no hardware da Nvidia. Deu destaque para o fato de ser muito diferente das redes de servidores tradicionais de data centers, devido à “quantidade de fios que se conecta a um único nó.”
Em suas palavras, a parte de trás de um computador possui inúmeros fios, que precisam de uma conexão no lugar certo. Dessa forma, manter as conexões exatas em um tempo tão grande, além de refrigerar o sistema adequadadamente, representa um grande desafio.
O fato de Elon Musk e sua equipe conseguirem essa proeza no evento mostra como o bilionário está se destacando em outras áreas além das quais ele é conhecido.
Famoso por suas invenções, Musk já é um grande nome no setor automobilístico, de exploração espacial e até mesmo no fornecimento de internet via satélite.
Agora, também traz seu nome para o cenário de equipamentos, com um recorde considerável que impressiona até mesmo os especialistas.
Todos esses feitos se interligam por uma coisa: tecnologia. Elon Musk está caminhando para ser a referência principal nesse setor, que se relaciona com todas as suas atividades. Pioneiro no uso da inteligência artificial para direção, construção de foguetes e comunicação, o bilionário segue impressionando com suas realizações.
Apesar das polêmicas, mostra como sua mente visionária irá trazer novos horizontes para a tecnologia.
Fonte: Adrenaline
Imagens: Freepik, Not a Tesla APP