我们估计,GPT-5.3-Codex在推理努力为`高`(而非`超高`)的情况下,其50%时间范围约为6.5小时(95%置信区间为3小时到17小时),适用于我们的软件任务套件。OpenAI为此次评估提供了API访问权限。