La ricerca sul "sandbagging" dell'AI sta diventando sempre più popolare recentemente. In questo 🧵, darò alcune ragioni per cui penso che non sia un paradigma di ricerca utile. TL;DR, penso che sia una riformulazione confusa di problemi già ben studiati e precedentemente risolti.
15,55K