DApp-butik | Web3-hubb för evenemang och spel

Trendande ämnen

Jag märker att på grund av (tror jag?) en hel del benchmarkmaxxing på uppgifter med lång horisont, blir LLM:er lite för agentiska som standard, lite utöver mitt genomsnittliga användningsfall. Till exempel inom kodning tenderar modellerna nu att resonera under ganska lång tid, de har en benägenhet att börja lista och hantera filer över hela repopot, de gör upprepade webbsökningar, de överanalyserar och övertänker små sällsynta gränsfall även i kod som är medvetet ofullständig och under aktiv utveckling, och kommer ofta tillbaka ~minuter senare även för enkla frågor. Detta kan vara vettigt för långvariga uppgifter, men det passar mindre bra för mer "i loopen" itererad utveckling som jag fortfarande gör mycket av, eller om jag bara letar efter en snabb stickprovskontroll innan jag kör ett skript, ifall jag fick någon indexering fel eller gjorde något dumt fel. Så jag kommer på mig själv ganska ofta med att stoppa LLM:erna med varianter av "Stopp, du tänker för mycket på det här. Titta bara på den här enskilda filen. Använd inga verktyg. Överkonstruera inte", etc. I grund och botten när standard långsamt börjar krypa in i "ultrathink" super agentic-läget, känner jag ett behov av det omvända, och mer generellt bra sätt att indikera eller kommunicera avsikt / insatser, från "bara ta en snabb titt" hela vägen till "gå iväg i 30 minuter, kom tillbaka när du är helt säker".

125,75K

Topp

Rankning

Favoriter

Trendande på kedjan

Trendande på X

Senaste toppfinansieringarna

Mest anmärkningsvärda