我們估計,GPT-5.3-Codex 在推理努力為 `high`(而非 `xhigh`)的情況下,對我們的軟體任務套件的 50% 時間範圍約為 6.5 小時(95% 置信區間為 3 小時到 17 小時)。OpenAI 提供了 API 訪問以進行此評估。