Estimamos que GPT-5.3-Codex con el esfuerzo de razonamiento 'alto' (no 'alto') tiene un horizonte temporal del 50% de alrededor de 6,5 horas (IC del 95% de 3 a 17 horas) en nuestro conjunto de tareas de software. OpenAI proporcionó acceso a la API para esta evaluación.