Podczas gdy Kimi k2 firmy Moonshot AI jest wiodącym modelem bez rozumowania o otwartych wagach w Indeksie Sztucznej Inteligencji Analizy, generuje ~ 3 razy więcej tokenów niż inne modele nierozumujące, zacierając granice między rozumowaniem a nierozumowaniem Kimi k2 to największy jak dotąd model dużych otwartych odważników - 1T łącznych parametrów przy 32B aktywnych (wymaga to ogromnego 1 TB pamięci w natywnym FP8 do utrzymania mas). Mamy k2 na 57 miejscu w Artificial Analysis Intelligence Index, imponujący wynik, który plasuje go powyżej modeli takich jak GPT-4.1 i DeepSeek V3, ale za wiodącymi modelami rozumowania. Do tej pory w naszych ewaluacjach istniało wyraźne rozróżnienie między modelem rozumowania a modelami nierozumującymi - definiowanymi nie tylko przez to, czy model używa <reasoning> tagów, ale przede wszystkim przez użycie tokenów. Mediana liczby tokenów używanych do udzielenia odpowiedzi na wszystkie oceny w Indeksie Sztucznej Analizy Inteligencji jest ~10 razy wyższa dla modeli rozumujących niż dla modeli bez rozumowania. @Kimi_Moonshot's Kimi k2 zużywa ~3 razy więcej tokenów niż mediana modelu nierozumującego. Jego użycie tokenów jest tylko do 30% niższe niż Claude 4 Sonnet i Opus, gdy są uruchomione w trybie myślenia o maksymalnym budżecie rozszerzonym i jest prawie trzykrotnie większe niż użycie tokenów zarówno Claude 4 Sonnet, jak i Opus z wyłączonym rozumowaniem. Dlatego zalecamy, aby Kimi k2 był porównywany z Claude 4 Sonnet i Opus w ich maksymalnie budżetowych rozszerzonych trybach myślenia, a nie z nieuzasadnionymi wynikami dla modeli Claude 4. Kimi k2 jest dostępny w interfejsie API @Kimi_Moonshot firmy first-party, a także w @FireworksAI_HQ, @togethercompute, @novita_labs i @parasail_io. Zobacz poniżej i na Sztuczna analiza w celu dalszej analizy 👇
60,67K