O $NBIS agora possui a inferência mais rápida do mundo em hardware $NVDA ?


A Nebius adquiriu a Eigen AI por $643M em dinheiro e ações, trazendo a inferência e a otimização pós-treinamento da Eigen diretamente para a Nebius Token Factory
Na keynote do GTC 2026 da NVIDIA, a Eigen AI ficou em 1º lugar em velocidade de saída para Kimi K2.5 Reasoning, enquanto a Nebius Fast ficou quase empatada com ela
A Nebius Fast também ocupa o primeiro lugar em velocidade de inferência em hardware $NVDA para o modelo de código aberto do ChatGPT, gpt-oss-120B
Além disso, a Eigen ficou em 1º lugar como provedora baseada em GPU em 25 modelos de código aberto na Artificial Analysis, excluindo provedores de ASIC, sob configurações padrão de 10K entradas. Ela também é a provedora mais rápida para Qwen3 Coder 480B, com 255,8 t/s, à frente do Google Vertex com 169,2 t/s e da Amazon com 121,3 t/s
Isso significa que a Eigen é cerca de 51% mais rápida que o Google Vertex e mais de 2x mais rápida que a Amazon nesse benchmark
━━━━━━━━━━━━━━━━━━━━
Embora o custo de aquisição pareça alto, se a Eigen realmente puder melhorar o desempenho de $NBIS na inferência, mesmo que levemente, terá um efeito composto a longo prazo sobre os lucros e o posicionamento competitivo que provavelmente mais do que se pagará
━━━━━━━━━━━━━━━━━━━━
A Nebius possui a nuvem de GPUs, enquanto a Eigen melhora a eficiência com que essas GPUs geram tokens. No mesmo hardware NVIDIA, o desempenho não depende apenas de capex. Depende da utilização da GPU, otimização do modelo, agrupamento, latência, gerenciamento de memória e kernels personalizados
A stack da Eigen foca em áreas como quantização, otimização de cache KV, esparsidade, decodificação especulativa, kernels CUDA e Triton personalizados, agrupamento contínuo e otimização em tempo de execução
Se a Nebius puder gerar mais throughput de inferência com o mesmo hardware NVIDIA, ela melhora a capacidade de receita, o custo por token e a margem bruta sem exigir aumentos proporcionais de capex
$NBIS está a caminho de se tornar uma empresa com receita anual de dezenas de bilhões, o que significa que mesmo alguns pontos percentuais de melhoria na inferência podem se traduzir em centenas de milhões em economia
━━━━━━━━━━━━━━━━━━━━
Modelos de código aberto estão evoluindo rapidamente. Kimi, Qwen, DeepSeek, GLM, Llama, Nemotron, MiniMax e outros modelos requerem otimizações constantes para manter a competitividade
Ao integrar a Eigen, a Nebius também pode lançar versões otimizadas mais rapidamente e tornar a Token Factory mais atraente para desenvolvedores e clientes empresariais
EIGEN-1,82%
Ver original
post-image
post-image
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • 1
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Saidur48
· 2h atrás
2026 GOGOGO 👊
Responder0
  • Fixar