DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Connor Davis

🔥 No puedo creer que esto exista... alguien finalmente escribió el manual secreto que todas las startups de agentes de IA han estado fingiendo. Un equipo de investigación acaba de lanzar "Una Guía Práctica para Diseñar, Desarrollar y Desplegar Flujos de Trabajo de IA Agente de Grado de Producción" y es básicamente el manual interno que la gente *piensa* que OpenAI y Anthropic utilizan. No es hype. No son diagramas con flechas lindas. Es un verdadero plano de ingeniería para agentes que no colapsan en el momento en que sales del sandbox de demostración. Aquí está lo que lo hace increíble 👇 1 / Comienzan exponiendo por qué la mayoría de los agentes implosionan Nunca es el modelo. Es el sistema que lo rodea: • enrutamiento de herramientas no determinista • fallos silenciosos de MCP • agentes improvisando el orden de ejecución • flujos de trabajo produciendo resultados diferentes en cada ejecución Muestran trazas de fallos en bruto — registros reales de agentes fallando, haciendo bucles o alucinando herramientas. Se lee como una autopsia de cada demostración de "empleado de IA autónomo". 2 / Reconstruyen toda la pila alrededor del determinismo Cada llamada a la herramienta se convierte en una función tipada. Cada camino de ejecución es reproducible. Cada paso es determinista. Si el sistema no puede producir la misma salida dos veces, no es de grado de producción. Esta regla sola elimina la mitad del caos que la gente confunde con "emergencia". 3 / Hacen cumplir agentes de responsabilidad única No hay mega-agente con 12 personalidades. En su lugar: • planificador • agente de razonamiento • ejecutor de herramientas • validador • sintetizador Cada uno con límites estrictos. Sin herramientas alucinadas. Sin razonamiento de tareas mixtas. Sin trabajo independiente. Esto es ingeniería de backend, no juego de roles. 4 / Externan cada prompt como una configuración real Los prompts ya no son cadenas ocultas — son: • controlados por versiones • auditables • diferenciables • recargables Esto crea un comportamiento estable y previene regresiones invisibles. 5 / Ejecutan un consorcio de modelos con un adjudicador GPT + Claude + Gemini no son intercambiables. Son colaboradores. Cada uno produce un borrador. Un agente de razonamiento los fusiona, resuelve contradicciones y produce un resultado unificado. Debate estructurado, no ruleta de modelos. 6 / Desacoplan el motor de flujo de trabajo de la capa MCP Separan: • orquestación • acceso a herramientas • reintentos • verificaciones de salud • escalado • observabilidad Resultado: un sistema de agentes que se comporta como microservicios, no como un macro de chat pegado con cinta. 7 / Luego prueban todo con un pipeline de producción real Un sistema completo de noticias ➝ análisis ➝ guion ➝ razonamiento ➝ audio ➝ video ➝ PR de GitHub. Diagramas completos. Trazas completas. Fallos reales. Soluciones reales. Es lo más cercano que este campo tiene a una arquitectura canónica para agentes que sobreviven a la carga del mundo real. Si tu pila de agentes no tiene: • flujos de trabajo deterministas • responsabilidades aisladas • prompts externalizados • arbitraje multi-modelo • infraestructura adecuada • plena observabilidad …no estás construyendo agentes. Estás construyendo demostraciones. Esta guía es el primer verdadero plano para sistemas de IA de producción y eleva el estándar para todos.

Parte superior

Clasificación

Favoritos