Det er mandag, og vi kunne alle trenge litt hjelp til å tenke. Heldigvis har vi den nye Kimi K2 Thinking til å gjøre det for oss.
Kimi K2 Thinking er nå live i våre modell-APIer med den mest effektive TTFT (0,3 sek) og TPS (140) på @OpenRouterAI og @ArtificialAnlys . Hvis du leter etter et alternativ til GPT-5, bruker koding eller bygger agentisk AI, *må* du prøve denne modellen.
Gratulerer @Kimi_Moonshot, dere er alle forbløffende.
Få tilgang i kommentarfeltet ➡️
Etter måneder med tilbakemeldinger fra våre tidlige kunder og tusenvis av fullførte jobber, er Baseten Training offisielt klar for alle. 🚀
Få tilgang til databehandling ved behov, lær opp en hvilken som helst modell, kjør jobber med flere noder og distribuer fra sjekkpunkter med hurtigbufferbevisst planlegging, en ML-kokebok, oppskrifter for verktøyanrop og mer.
Denne uken låste Basetens modellytelsesteam opp den raskeste TPS og TTFT for gpt-oss 120b på @nvidia maskinvare. Da gpt-oss ble lansert, spurtet vi for å tilby den til 450 TPS ... nå har vi overskredet 650 TPS og 0.11 sek TTFT ... Og vi vil fortsette å jobbe for å fortsette å heve standarden.
Vi er stolte av å tilby den beste E2E-ventetiden som er tilgjengelig med nesten ubegrenset skala, utrolig ytelse og den høyeste oppetiden 99,99 %.