Возможно, самый убедительный бенчмарк GPT-5: он был сопоставим с человеческими экспертами примерно по половине задач в сложной, экономически ценной интеллектуальной работе в различных областях.
2,76K