Alibaba випустила Qwen3 Next 80B: гібридну модель міркування з відкритими вагами, яка досягає інтелекту рівня DeepSeek V3.1 з активними параметрами лише 3B Ключові моменти: 💡 Нова архітектура: Перша модель, яка представила базові моделі @Alibaba_Qwen Qwen3-Next, з декількома ключовими архітектурними рішеннями, такими як гібридний механізм уваги Gated DeltaNet і Gated Attention, і високою розрідженістю з часткою активних параметрів 3,8%, в порівнянні з 9,4% для Qwen3 235B 🧠 Інтелект: Qwen3 Next 80B (Міркування) має 54 бали за Індексом інтелекту штучного аналізу, розміщеним поряд із DeepSeek V3.1 (Міркування). Варіант без обґрунтування набрав 45 балів, відповідно до gpt-oss-20B і Llama Nemotron Super 49B v1.5 (Reasoning) 💲 Модель ціноутворення: Ціна за токен на @alibaba_cloud становить $0,5/$6 за 1 млн вхідних/вихідних токенів для міркувань і $0,5/$2 для варіанту без обґрунтування. Це можна порівняти з вищими цінами на Qwen3 235B 2507 $0,7/$8,4 з міркувань і $0,7/$2,8 без - зниження на ≥25% залежно від завантаженості ⚙️ Деталі моделі: Модель має власне контекстне вікно з 256 тисячами токенів і є лише текстовою, без мультимодальних входів або виходів. При параметрах всього 80B при FP8 модель вміщується на одному графічному процесорі H200