DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Ik merk dat, door (denk ik?) veel benchmarkmaxxing op lange termijn taken, LLM's standaard een beetje te agentisch worden, iets verder dan mijn gemiddelde gebruiksgeval. Bijvoorbeeld in codering, de modellen hebben nu de neiging om vrij lang na te denken, ze hebben de neiging om bestanden door de hele repo te gaan opsommen en te greppen, ze doen herhaalde webzoektochten, ze analyseren en denken te veel na over zeldzame randgevallen, zelfs in code die bewust onvolledig is en actief in ontwikkeling is, en komen vaak pas ~ minuten later terug, zelfs voor eenvoudige vragen. Dit kan logisch zijn voor langdurige taken, maar het past minder goed bij meer "in de loop" iteratieve ontwikkeling die ik nog steeds veel doe, of als ik gewoon een snelle controle wil doen voordat ik een script uitvoer, voor het geval dat ik een indexering verkeerd heb of een domme fout heb gemaakt. Dus kom ik er vaak achter dat ik de LLM's stopzet met variaties van "Stop, je denkt hier veel te veel over na. Kijk alleen naar dit enkele bestand. Gebruik geen tools. Over-engineer niet", enz. In wezen, terwijl de standaard langzaam begint te kruipen in de "ultrathink" super agentic modus, voel ik de behoefte aan het omgekeerde, en meer algemeen goede manieren om intentie / inzet aan te geven of te communiceren, van "kijk gewoon snel" tot "ga 30 minuten weg, kom terug wanneer je absoluut zeker bent."

125,7K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste