DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Connor Davis

🔥 Non posso credere che questo esista... qualcuno ha finalmente scritto il manuale segreto che ogni startup di agenti AI ha finto di avere. Un team di ricerca ha appena pubblicato "Una Guida Pratica per Progettare, Sviluppare e Distribuire Flussi di Lavoro AI Agenti di Qualità Produttiva" ed è fondamentalmente il manuale interno che la gente *pensa* OpenAI e Anthropic utilizzino. Niente hype. Niente diagrammi con frecce carine. Un vero progetto ingegneristico per agenti che non collassano nel momento in cui lasci il sandbox di demo. Ecco cosa lo rende pazzesco 👇 1 / Iniziano esponendo perché la maggior parte degli agenti implode Non è mai il modello. È il sistema attorno ad esso: • instradamento degli strumenti non deterministico • fallimenti silenziosi del MCP • agenti che improvvisano l'ordine di esecuzione • flussi di lavoro che producono risultati diversi ad ogni esecuzione Mostrano tracce di fallimento grezze — log reali di agenti che sbagliano, si bloccano o allucinano strumenti. Si legge come un'autopsia di ogni demo di "dipendente AI autonomo". 2 / Ricostruiscono l'intero stack attorno al determinismo Ogni chiamata a uno strumento diventa una funzione tipizzata. Ogni percorso di esecuzione è riproducibile. Ogni passo è deterministico. Se il sistema non può produrre lo stesso output due volte, non è di qualità produttiva. Questa regola da sola uccide metà del caos che la gente scambia per "emergenza". 3 / Impongono agenti a responsabilità singola Niente mega-agente con 12 personalità. Invece: • pianificatore • agente di ragionamento • esecutore di strumenti • validatore • sintetizzatore Ognuno con confini rigorosi. Niente strumenti allucinati. Niente ragionamento misto. Niente lavoro freelance. Questa è ingegneria backend, non gioco di ruolo. 4 / Esternalizzano ogni prompt come una vera configurazione I prompt non sono più stringhe nascoste — sono: • versionati • auditabili • differenziabili • ricaricabili Questo crea un comportamento stabile e previene regressioni invisibili. 5 / Gestiscono un consorzio di modelli con un giudice GPT + Claude + Gemini non sono intercambiabili. Sono collaboratori. Ognuno produce una bozza. Un agente di ragionamento le unisce, risolve le contraddizioni e produce un risultato unificato. Debate strutturato, non roulette dei modelli. 6 / Decouplano il motore di flusso di lavoro dal livello MCP Separano: • orchestrazione • accesso agli strumenti • ripetizioni • controlli di salute • scalabilità • osservabilità Risultato: un sistema di agenti che si comporta come microservizi, non come un macro di chat incollato. 7 / Poi provano tutto con una vera pipeline di produzione Un sistema completo di notizie ➝ analisi ➝ script ➝ ragionamento ➝ audio ➝ video ➝ PR di GitHub. Diagrammi completi. Tracce complete. Fallimenti reali. Correzioni reali. È la cosa più vicina che questo campo ha a un'architettura canonica per agenti che sopravvivono a un carico del mondo reale. Se il tuo stack di agenti non ha: • flussi di lavoro deterministici • responsabilità isolate • prompt esternalizzati • arbitraggio multi-modello • infrastruttura adeguata • piena osservabilità ...non stai costruendo agenti. Stai costruendo demo. Questa guida è il primo vero progetto per sistemi AI di produzione e alza il livello per tutti.

Principali

Ranking

Preferiti