За словами @ArtificialAnlys, Hyperbolic виділяється високою продуктивністю в різних контекстах. Наша модель gpt-oss-120b від @OpenAI забезпечує 402 токени/сек і залишається стабільною щодо тривалості контексту, що ставить нас у один ряд із найшвидшими постачальниками висновків.
🚀 Qwen3-Next, що працює на базі NVIDIA: тепер у прямому ефірі Hyperbolic
Чудові тести Hyperbolic для Qwen3-Next-80B-A3B працюють на наших кластерах NVIDIA @nvidia, оснащених графічними процесорами H100 і H200 на вимогу, оптимізованими для робочих навантажень штучного інтелекту. Графічні процесори NVIDIA H100 і H200 живлять нашу інфраструктуру завдяки своїй архітектурі Hopper, забезпечуючи обчислення, необхідні для масивних моделей MoE Qwen3-Next. У той час як H100 пропонують 80 ГБ пам'яті HBM3, H200 оновлюються до 141 ГБ пам'яті HBM3e з кращою продуктивністю до 45%.
Бенчмаркінг Qwen3-Next-80B-A3B: чому гіперболічний лідирує
Нещодавній порівняльний аналіз від @ArtificialAnlys ставить Hyperbolic на перше місце для Qwen3-Next-80B-A3B-Thinking та Qwen3-Next-80B-A3B-Instruct за всіма ключовими показниками: швидкістю, затримкою та вартістю.