Moim zdaniem, koncepcja "sandbagging" trochę zasłania to, o co chodzi w "sandbagging" (gra słów zamierzona) Głównym problemem w tej chwili jest to, że deweloperzy AI stosują sandbagging, nie robiąc wystarczająco dużo, aby wywołać najlepsze zachowanie, a nie modele AI stosujące sandbagging.
Cas (Stephen Casper)
Cas (Stephen Casper)24 sie, 19:00
Badania nad "sandbaggingiem" AI stają się ostatnio coraz bardziej popularne. W tym 🧵 przedstawię kilka powodów, dla których uważam, że to nie jest użyteczny paradygmat badawczy. TL;DR, uważam, że to mylące przekształcenie dość dobrze zbadanych i wcześniej rozwiązanych problemów.
3,78K