Магазин DApp | Центр Web3 для подій та ігор

Актуальні теми

Connor Davis

🔥 Не можу повірити, що це існує... хтось нарешті написав секретний підхід, який кожен стартап AI-агентів підробляв. Дослідницька група щойно опублікувала «Практичний посібник з проєктування, розробки та впровадження робочих процесів агентного AI виробництва», і це, по суті, внутрішній посібник, який люди *вважають* OpenAI та Anthropic. Не хайп. Не діаграми з милими стрілками. Справжній інженерний план для агентів, які не розпадаються, щойно ви виходите з демо-пісочниці. Ось що робить це божевільним 👇 1 / Вони починають з того, що викривають, чому більшість агентів руйнуються Проблема ніколи не в моделі. Це система навколо нього: • недетермінована маршрутизація інструментів • тихі невдачі MCP • агенти, які імпровізують наказ про страту • робочі процеси, що дають різні результати при кожному виконанні Вони показують чисті сліди відмов — реальні журнали агентів, які не запускали, зациклювали або виявляли інструменти. Це виглядає як розтин кожної демонстрації «автономного працівника ШІ». 2 / Вони перебудовують весь стек навколо детермінізму Кожен виклик інструменту стає типізованою функцією. Кожен шлях виконання можна перепроходити. Кожен крок є детермінованим. Якщо система не може видавати однаковий вихід двічі, це не виробничий клас. Саме це правило вбиває половину хаосу, якого люди плутають за «виникнення». 3 / Вони забезпечують виконання агентів з єдиною відповідальністю Немає мега-агента з 12 особистостями. Замість цього: •Планувальник • агент розуму • виконавець інструменту • валідатор •Синтезатор Кожен має суворі межі. Жодних галюцинаційних інструментів. Жодних змішаних завдань міркування. Ніякого фрілансу. Це бекенд-інженерія, а не рольова гра. 4 / Вони виводять кожен запит назовні, як справжню конфігурацію Підказки більше не є прихованими нитками — вони: • версія керується • аудитуваний • дифлябельність • перезаряджуваний Це створює стабільну поведінку та запобігає невидимим регресіям. 5 / Вони керують модельним консорціумом з арбітром GPT + Claude + Gemini не взаємозамінні. Вони співпрацюють. Кожен створює чернетку. Агент логіки об'єднує їх, розв'язує суперечності і дає єдиний результат. Структуровані дебати, а не модельна рулетка. 6 / Вони відокремлюють рушій робочого процесу від рівня MCP Вони розділяються: •Оркестровки • доступ до інструментів •Спроб • медичні перевірки •Масштабування • спостережуваність Результат: агентна система, яка поводиться як мікросервіси, а не як шаблонний чат-макрос. 7 / Потім вони все доводять за допомогою справжнього виробничого конвеєра Повна новина ➝ аналіз ➝ сценарій ➝ міркування ➝ аудіо ➝ відео ➝ PR-система GitHub. Повні схеми. Повні сліди. Справжні невдачі. Справжні виправлення. Це найближче до канонічної архітектури для агентів, які виживають у реальному навантаженні. Якщо у вашому стеку агентів немає: • детерміновані робочі процеси • ізольовані обов'язки • зовнішні підказки • багатомодельний арбітраж • належна інфраструктура • повна спостережуваність … Ви не будівельні агенти. Ти будуєш демонстрації. Цей посібник є першим справжнім кресленням для виробничих AI-систем і піднімає планку для всіх.

Святі небеса... ця стаття, можливо, є найважливішим зрушенням у тому, як ми використовуємо LLM протягом усього року. "Великі причинні моделі з великих мовних моделей." Це показує, що можна вирощувати повні причинні моделі безпосередньо з LLM, а не з апроксимації, не з вібрацій, з реальних причинних графів, контрфактичних аргументів, інтервенцій і структур, що перевіряються обмеженнями. І спосіб, у який вони це роблять, просто неймовірний: Замість того, щоб навчати спеціалізовану причинну модель, вони допитують LLM, як науковець: → витягти кандидатний причинний граф із тексту → попросити модель перевірити умовні незалежності → виявляти суперечності → переглянути структуру → тестувати контрфакти та інтервенційні прогнози → ітерації, доки причинна модель не стабілізується Результат — це те, чого ми ніколи раніше не мали: причинно-наслідкову систему, побудовану всередині LLM із використанням власних знань прихованого світу. У синтетичних, реальних, заплутаних доменах ці LCM перевершують класичні методи причинного відкриття, оскільки вони спираються на величезні попередні знання LLM, а не лише на локальні кореляції. А контрфактичне міркування? Вражаюче сильний. Модель може відповісти на питання «а що як», на які стандартні алгоритми повністю не справляються, просто тому, що вона вже «знає» про світ речі, які ці алгоритми не можуть зробити лише з даних. Ця стаття натякає на майбутнє, де LLM — це не просто машини для створення шаблонів. Вони стають системами причинних двигунів, які формують, тестують і вдосконалюють структурні пояснення реальності. Якщо це масштабується, кожна галузь, що базується на економіці причинних висновків, медицині, політиці, науці, ось-ось буде переписана. LLM не просто розкажуть, що відбувається. Вони скажуть чому.

Найкращі

Рейтинг

Вибране