Argomenti di tendenza
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Potremmo affrontare questo tramite esecuzione vincolata.
Vincola la lunghezza dell'output, come il limite di 140 caratteri su Twitter.
Oppure vincola il tempo di esecuzione, come la modalità in tempo reale in Linux.


10 ago, 00:53
Sto notando che, a causa di (penso?) molto benchmarkmaxxing su compiti a lungo termine, i LLM stanno diventando un po' troppo agentici per impostazione predefinita, un po' oltre il mio caso d'uso medio.
Ad esempio, nella programmazione, i modelli tendono ora a ragionare per un tempo piuttosto lungo, hanno un'inclinazione a iniziare a elencare e cercare file in tutto il repository, fanno ricerche web ripetute, analizzano e riflettono eccessivamente su piccoli casi limite rari anche in codice che è consapevolmente incompleto e in fase di sviluppo attivo, e spesso tornano ~minuti dopo anche per query semplici.
Questo potrebbe avere senso per compiti a lungo termine, ma è meno adatto per uno sviluppo iterato più "in loop" che faccio ancora molto, o se sto solo cercando un rapido controllo prima di eseguire uno script, giusto nel caso in cui abbia sbagliato qualche indicizzazione o fatto qualche errore stupido. Quindi mi trovo spesso a fermare i LLM con variazioni di "Fermati, stai pensando troppo. Guarda solo questo singolo file. Non usare strumenti. Non sovra-ingegnerizzare", ecc.
Fondamentalmente, mentre il predefinito inizia a insinuarsi lentamente nella modalità "ultrathink" super agentica, sento il bisogno dell'opposto, e in generale buoni modi per indicare o comunicare intenzioni / stake, da "dai solo un'occhiata veloce" fino a "vai via per 30 minuti, torna quando sei assolutamente certo".
Non è necessario utilizzare i concetti esattamente, ma le idee dallo sviluppo di sistemi operativi in tempo reale potrebbero essere incorporate come vincoli durante l'addestramento e la valutazione dell'IA.
Il tempo reale morbido potrebbe essere sufficiente. A meno che non si tratti di un incidente automobilistico se non funziona, come nel caso del tempo reale rigido.

104,45K
Principali
Ranking
Preferiti