Сегодня понедельник, и нам всем нужна небольшая помощь в размышлениях. К счастью, у нас есть новый Kimi K2 Thinking, который сделает это за нас.
Kimi K2 Thinking теперь доступен в наших Model APIs с самой высокой производительностью TTFT (0.3 сек) и TPS (140) на @OpenRouterAI и @ArtificialAnlys. Если вы ищете альтернативу GPT-5, используете кодирование или создаете агентный ИИ, вам *нужно* попробовать эту модель.
Поздравляю @Kimi_Moonshot, вы все потрясающие.
Получите доступ в комментариях ➡️
После месяцев обратной связи от наших первых клиентов и тысяч выполненных заданий, Baseten Training официально готов для всех. 🚀
Получите доступ к вычислениям по запросу, обучайте любые модели, запускайте многопроцессорные задания и развертывайте из контрольных точек с учетом кэша, с помощью ML Cookbook, рецептов вызова инструментов и многого другого.
На этой неделе команда по производительности моделей Baseten разблокировала самый быстрый TPS и TTFT для gpt-oss 120b на оборудовании @nvidia. Когда gpt-oss был запущен, мы стремились предложить его с 450 TPS... теперь мы превысили 650 TPS и 0.11 сек TTFT... и мы продолжим работать, чтобы поднять планку.
Мы гордимся тем, что предлагаем лучшую доступную задержку E2E с почти безграничным масштабом, невероятной производительностью и максимальным временем безотказной работы 99.99%.