DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Observ că, din cauza (cred?) multor benchmarkmaxxing pe sarcini cu orizont lung, LLM-urile devin puțin prea agentice în mod implicit, puțin peste cazul meu mediu de utilizare. De exemplu, în codare, modelele tind acum să raționeze destul de mult timp, au o înclinație de a începe să listeze și să grepeze fișiere pe tot depozitul, fac căutări web repetate, analizează prea mult și se gândesc prea mult la mici cazuri limită rare chiar și în cod care este cu bună știință incomplet și în curs de dezvoltare activă și adesea revin ~ minute mai târziu chiar și pentru interogări simple. Acest lucru ar putea avea sens pentru sarcinile de lungă durată, dar este mai puțin potrivit pentru o dezvoltare iterată mai "în buclă" pe care încă o fac mult, sau dacă caut doar o verificare rapidă înainte de a rula un script, în cazul în care am greșit o indexare sau am făcut o eroare stupidă. Așa că mă trezesc destul de des oprind LLM-urile cu variații de "Stop, te gândești prea mult la asta. Uitați-vă doar la acest singur fișier. Nu utilizați unelte. Nu supra-proiecta", etc. Practic, pe măsură ce implicitul începe să se strecoare încet în modul super agentic "ultrathink", simt nevoia de a inversa și, în general, modalități bune de a indica sau comunica intenția / miza, de la "doar aruncați o privire rapidă" până la "opriți-vă timp de 30 de minute, întoarceți-vă când sunteți absolut siguri".

125,7K

Limită superioară

Clasament

Favorite

La modă pe lanț

La modă pe X

Principalele finanțări recente

Cele mai importante