Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Voisimme puuttua tähän rajoitetulla toteutuksella.
Rajoita tulosteen pituutta, kuten Twitterin 140 merkin rajoitus.
Tai rajoita ajoaikaa, kuten reaaliaikainen tila Linuxissa.


10.8. klo 00.53
Olen huomannut, että pitkän horisontin tehtävien (luulen?) suuren vertailuarvon vuoksi LLM:istä on tulossa oletuksena hieman liian agenttisia, hieman keskimääräistä käyttötapaukseni yläpuolella.
Esimerkiksi koodauksessa malleilla on nyt taipumus järkeillä melko pitkään, heillä on taipumus alkaa listata ja tarttua tiedostoja koko arkistoon, he tekevät toistuvia verkkohakuja, he ylianalysoivat ja ajattelevat liikaa pieniä harvinaisia reunatapauksia jopa koodissa, joka on tietoisesti epätäydellistä ja aktiivisessa kehityksessä, ja palaavat usein ~minuutteja myöhemmin jopa yksinkertaisiin kyselyihin.
Tämä saattaa olla järkevää pitkäkestoisissa tehtävissä, mutta se ei sovi yhtä hyvin "silmukassa" iteroituun kehitykseen, jota teen edelleen paljon, tai jos etsin vain nopeaa pistokoketta ennen skriptin suorittamista, siltä varalta, että sain indeksoinnin väärin tai tein jonkin tyhmän virheen. Niinpä huomaan lopettavani LLM:t melko usein muunnelmilla "Lopeta, ajattelet tätä liikaa. Katso vain tätä yhtä tiedostoa. Älä käytä työkaluja. Älä suunnittele liikaa" jne.
Periaatteessa, kun oletusarvo alkaa hitaasti hiipiä "ultrathink"-superagenttitilaan, tunnen tarvetta päinvastaiselle ja yleisemmin hyville tavoille osoittaa tai kommunikoida aikomuksia/panoksia, "katso vain nopeasti" aina "mene pois 30 minuutiksi, tule takaisin, kun olet täysin varma".
Sinun ei tarvitse käyttää käsitteitä tarkasti, mutta reaaliaikaisen käyttöjärjestelmäkehityksen ideoita voidaan leipoa rajoituksina tekoälyn koulutuksen ja arvioinnin aikana.
Pehmeä reaaliaika voi riittää. Ellei kyseessä ole auto-onnettomuus, jos se ei toimi, kuten kova reaaliaika.

104,63K
Johtavat
Rankkaus
Suosikit