GPT-5 був запущений вчора. 94,6% на AIME 2025. 74,9% на SWE-bench. У міру наближення до верхньої межі цих орієнтирів вони гинуть. Що робить GPT-5 і наступне покоління моделей революційними, так це не їхні знання. Це знання того, як діяти. Для GPT-5 це відбувається на двох рівнях. По-перше, вирішивши, яку модель використовувати. Але по-друге, і що важливіше, через виклик інструментів. Ми живемо в епоху, коли LLM освоїли знання, пошук і повторне складання. Пошук споживачів і кодування, початкові вбивчі програми, по суті, є проблемами отримання знань. І те, і інше систематизує наявну інформацію по-новому. Ми піднялися на ці пагорби, і в результаті конкуренція стала сильнішою, ніж будь-коли. Моделі Anthropic, OpenAI та Google сходяться на схожих можливостях. Китайські моделі та альтернативи з відкритим вихідним кодом продовжують все більше наближатися до найсучасніших. Отримати інформацію може кожен. Згенерувати текст може кожен. Нова вісь конкуренції? Виклик інструментів. Виклик інструментів перетворює LLM з радників на акторів. Це компенсує дві критичні слабкості моделі, які моделі чистої мови не можуть подолати. По-перше, оркестрування робочих процесів. Моделі чудово справляються з одномоментними реакціями, але мають проблеми з багатоступінчастими процесами зі збереженням стану. Інструменти дозволяють їм керувати тривалими робочими процесами, відстежувати прогрес, обробляти помилки, підтримувати контекст у десятках операцій. По-друге, системна інтеграція. LLM живуть у світі лише тексту. Інструменти дозволяють їм передбачувано взаємодіяти із зовнішніми системами, такими як бази даних, API та корпоративне програмне забезпечення, перетворюючи природну мову на виконувані дії. За останній місяць я створив 58 різних інструментів штучного інтелекту. Обробники електронної пошти. Інтегратори CRM. Оновлювачі понять. Наукові співробітники. Кожен інструмент розширює можливості моделі в нову сферу. Найважливішою здатністю для штучного інтелекту є швидкий і правильний вибір правильного інструменту. Кожен неправильно спрямований крок вбиває весь робочий процес. Коли я кажу «прочитай цей лист від Y Combinator і знайди всі стартапи, яких немає в CRM», сучасні LLM виконують складну послідовність. Одна команда англійською мовою замінює весь робочий процес. І це лише простий. Ще краще, якщо модель, правильно налаштована за допомогою потрібних інструментів, зможе переконатися у власній роботі, що завдання були виконані вчасно. Цей цикл самоперевірки створює надійність у робочих процесах, якої важко досягти інакше. Помножте це на сотні співробітників. Тисячі робочих процесів. Продуктивність зростає в геометричній прогресії. Переможцями у майбутньому світі штучного інтелекту стануть ті, хто найдосвідченіший у оркеструванні інструментів та маршрутизації правильних запитів. Щоразу. Як тільки ці робочі процеси стануть передбачуваними, саме тоді ми всі станемо менеджерами агентів.
3,22K