De acordo com @ArtificialAnlys, o Hyperbolic destaca-se com um desempenho forte em diferentes comprimentos de contexto. O nosso modelo gpt-oss-120b da @OpenAI entrega 402 tokens/segundo e mantém-se consistente ao longo dos comprimentos de contexto, colocando-nos ao lado dos provedores de inferência mais rápidos.
🚀 Qwen3-Next com tecnologia NVIDIA: Agora disponível na Hyperbolic
Os benchmarks superiores da Hyperbolic para o Qwen3-Next-80B-A3B são alimentados pelos nossos clusters NVIDIA @nvidia, com GPUs H100 e H200 sob demanda, otimizadas para cargas de trabalho de IA. As GPUs H100 e H200 da NVIDIA alimentam nossa infraestrutura com sua arquitetura Hopper, fornecendo o poder computacional necessário para os enormes modelos MoE do Qwen3-Next. Enquanto as H100 oferecem 80GB de memória HBM3, as H200 fazem um upgrade para 141GB de memória HBM3e com até 45% de desempenho melhor.
Qwen3-Next-80B-A3B Benchmarking: Por que o Hyperbolic é o líder
Recentes benchmarks da @ArtificialAnlys colocam o Hyperbolic no topo para Qwen3-Next-80B-A3B-Thinking e Qwen3-Next-80B-A3B-Instruct em todas as métricas-chave: velocidade, latência e custo.