Chúng tôi ước tính rằng GPT-5.3-Codex với nỗ lực lý luận `cao` (không phải `rất cao`) có khoảng thời gian 50% là khoảng 6,5 giờ (Khoảng tin cậy 95% từ 3 giờ đến 17 giờ) trên bộ nhiệm vụ phần mềm của chúng tôi. OpenAI đã cung cấp quyền truy cập API cho đánh giá này.