Tällä viikolla Basetenin mallin suorituskykytiimi avasi nopeimman TPS:n ja TTFT:n gpt-oss 120b:lle @nvidia-laitteistolla. Kun gpt-oss lanseerattiin, spurttasimme tarjoamaan sitä 450 TPS:llä... nyt olemme ylittäneet 650 TPS:n ja 0,11 sekunnin TTFT:n... Ja jatkamme työtä riman nostamiseksi. Olemme ylpeitä voidessamme tarjota parhaan saatavilla olevan E2E-viiveen lähes rajattomalla skaalauksella, uskomattomalla suorituskyvyllä ja korkeimmalla 99,99 %:n käytettävyydellä.