Menurut pendapat saya, konsep "sandbagging" agak seperti apa yang dimaksud dengan "sandbagging" (permainan kata-kata) Masalah inti saat ini adalah pengembang AI sandbagging dengan tidak melakukan cukup untuk menimbulkan perilaku teratas, bukan sandbagging model AI
Cas (Stephen Casper)
Cas (Stephen Casper)24 Agu, 19.00
Penelitian tentang AI "sandbagging" semakin populer akhir-akhir ini. Dalam hal ini 🧵, saya akan memberikan beberapa alasan yang menurut saya bukan paradigma penelitian yang berguna. TL; DR, saya pikir ini adalah pembingkaian ulang yang membingungkan dari masalah yang dipelajari dengan cukup baik dan dipecahkan sebelumnya.
3,83K