Es ist Montag, und wir könnten alle ein wenig Hilfe beim Denken gebrauchen. Glücklicherweise haben wir das neue Kimi K2 Thinking, das es für uns erledigt.
Kimi K2 Thinking ist jetzt in unseren Model APIs live mit der leistungsfähigsten TTFT (0,3 Sek.) und TPS (140) bei @OpenRouterAI & @ArtificialAnlys. Wenn Sie nach einer Alternative zu GPT-5 suchen, Programmierung nutzen oder agentische KI aufbauen, *müssen* Sie dieses Modell ausprobieren.
Herzlichen Glückwunsch @Kimi_Moonshot, ihr seid erstaunlich.
Zugriff in den Kommentaren erhalten ➡️
Nach monatelangem Feedback von unseren frühen Kunden und tausenden abgeschlossenen Aufträgen ist Baseten Training offiziell für alle bereit. 🚀
Greifen Sie auf Rechenleistung nach Bedarf zu, trainieren Sie jedes Modell, führen Sie Multi-Node-Jobs aus und setzen Sie von Checkpoints mit cache-bewusster Planung, einem ML Cookbook, Rezepten zum Aufrufen von Tools und mehr ein.
In dieser Woche hat das Modellleistungsteam von Baseten die schnellsten TPS und TTFT für gpt-oss 120b auf @nvidia-Hardware freigeschaltet. Als gpt-oss gestartet wurde, haben wir uns beeilt, es mit 450 TPS anzubieten... jetzt haben wir 650 TPS und 0,11 Sek. TTFT überschritten... und wir werden weiterhin daran arbeiten, die Messlatte höher zu legen.
Wir sind stolz darauf, die beste E2E-Latenz mit nahezu unbegrenzter Skalierung, unglaublicher Leistung und der höchsten Verfügbarkeit von 99,99 % anzubieten.