Etter min mening er konseptet "sandbagging" litt sandsekker hva "sandbagging" handler om (ordspill ment) Kjerneproblemet akkurat nå er AI-utviklere sandbagging ved ikke å gjøre nok for å fremkalle toppoppførsel, ikke AI-modeller sandbagging
Cas (Stephen Casper)
Cas (Stephen Casper)24. aug., 19:00
Forskning på AI "sandbagging" har blitt mer populær i det siste. I dette 🧵 vil jeg gi noen grunner til at jeg mener det ikke er et nyttig forskningsparadigme. TL; DR, jeg synes det er en forvirrende omformulering av ganske godt studerte og tidligere løste problemer.
3,81K