Secondo me, il concetto di "sandbagging" in un certo senso sminuisce ciò di cui tratta il "sandbagging" (gioco di parole voluto) Il problema principale in questo momento è che gli sviluppatori di AI stanno "sandbagging" non facendo abbastanza per stimolare comportamenti ottimali, non i modelli di AI che stanno "sandbagging".
Cas (Stephen Casper)
Cas (Stephen Casper)24 ago, 19:00
La ricerca sul "sandbagging" dell'AI sta diventando sempre più popolare recentemente. In questo 🧵, darò alcune ragioni per cui penso che non sia un paradigma di ricerca utile. TL;DR, penso che sia una riformulazione confusa di problemi già ben studiati e precedentemente risolti.
3,8K