Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ein einzelner RAG ist das Produkt der ersten Generation von Verbesserungen. Mein aktueller Ansatz besteht darin, RAG als MCP zu implementieren und zwei APIs anzubieten: Ask und Fetch. Die Abfrage erfolgt weiterhin über den traditionellen RAG-Mechanismus, während das erweiterte Lesen es der KI ermöglicht, Fetch aufzurufen, um den Kontext davor und danach zu lesen. Mechanisch ähnelt es dem erneuten Lesen von Dateien mit Cline Grep.

21. Aug., 07:39
Ich stimme voll und ganz zu: 1. Multi-Agenten-Kooperation ist nicht so stabil wie Einzel-Thread; 2. RAG ist unzuverlässig und schlechter als traditionelle Suche; 3. Je mehr Anweisungen in den Eingabeaufforderungen, desto weniger weiß das Modell, was es auswählen soll.
—— Die Übersetzung des ursprünglichen Tweets lautet ——
Auf dem Weg zur Entwicklung von AI-Agenten hat unser Team @Cline drei Arten von "Denkviren" identifiziert. Diese "Denkviren" sind verlockende Ideen, die zwar klug klingen, in der Praxis jedoch völlig unbrauchbar sind.
Diese drei Viren sind:
* Multi-Agenten-Kooperation (Multi-Agent Orchestration)
* Retrieval Augmented Generation (RAG)
* Je mehr Anweisungen, desto besser das Ergebnis
Lassen Sie uns das näher betrachten!
1. Multi-Agenten-Kooperation
Die Szenen aus Science-Fiction-Filmen – "Hintergrund-Agenten, Versorgungs-Agenten, Analyse-Agenten, Kommandanten-Agenten" schicken eine große Gruppe von Unter-Agenten los, um die Ergebnisse am Ende zusammenzufassen – klingen wirklich cool. Aber die Realität ist, dass die meisten nützlichen Agentenarbeiten Einzel-Thread-basiert sind.
Komplexe Kooperationsprozesse bringen selten echten Wert, sondern verursachen oft Chaos. Man muss wissen, dass es schon schwierig genug ist, das Modell in einem Einzel-Thread stabil arbeiten zu lassen, ganz zu schweigen von der Handhabung paralleler Kooperationslogik. Dies erhöht nicht nur die Komplexität der Implementierung, sondern macht auch den Verständnis- und Entscheidungsprozess des Modells außergewöhnlich kompliziert.
2. Verwendung von RAG zur Erstellung von Agenten
RAG, also Retrieval Augmented Generation, ist ebenfalls ein Denkvirus. Theoretisch sieht es sehr mächtig aus, aber in der Praxis, insbesondere im Agentenszenario, ist manchmal sogar GREP, dieser grundlegende Textsuchbefehl, nützlicher als es.
Warum verblasst der Glanz von RAG in den tatsächlichen Arbeitsabläufen von Agenten? Weil die abgerufenen Informationen oft fragmentarisch sind und das Modell nicht in der Lage ist, ein kohärentes, nützliches "Verständnis" zu entwickeln.
Eine bessere Methode ist fast immer: Lassen Sie das Modell selbst die Dateien auflisten, suchen Sie auf eine ähnliche Weise wie grep und öffnen und lesen Sie die gesamte Datei (wie ein Mensch). Das @Cline-Team hat damit frühzeitig begonnen, und später sahen wir, dass @Amp – Research Preview und @Cursor ebenfalls zu dieser pragmatischeren Methode übergegangen sind.
3. Je mehr Anweisungen, desto besser das Ergebnis
Es gibt ein weit verbreitetes Missverständnis: Wenn man immer mehr "Anweisungen" in die Systemaufforderung (system prompt) packt, wird das Modell intelligenter. Das ist völlig falsch.
Das "Wassertrinken" der Eingabeaufforderungen verwirrt das Modell nur, da mehr Anweisungen oft zu widersprüchlichen Vorschlägen und Informationsüberlastung führen.
Das Ergebnis ist, dass man ständig die seltsamen Verhaltensweisen des Modells reparieren muss, als würde man ein "Wack-a-Mole"-Spiel spielen, anstatt wirklich nützliche Ausgaben zu erhalten. Für die meisten modernen Spitzenmodelle ist die beste Methode, ihnen nicht im Weg zu stehen, anstatt daneben zu stehen und ständig zu schreien, um sie in eine bestimmte Richtung zu lenken. Schätzen Sie jedes Ihrer Worte (oder Tokens).
Zusammenfassend lässt sich sagen, dass all diese drei Ideen äußerst verlockend sind. Wenn Sie nicht den ganzen Tag mit AI zu tun haben, könnten Sie denken, dass sie alle sehr sinnvoll sind – aber das ist nicht der Fall. Natürlich könnte sich unsere Sicht auf diese Methoden in Zukunft ändern, wenn sich die Fähigkeiten der zugrunde liegenden Modelle verbessern.
6,24K
Top
Ranking
Favoriten