En mi opinión, el concepto de "sandbagging" en cierto modo oculta de qué se trata el "sandbagging" (juego de palabras intencionado) El problema principal en este momento son los desarrolladores de IA que están sandbagging al no hacer lo suficiente para provocar un comportamiento óptimo, no los modelos de IA que están sandbagging.
Cas (Stephen Casper)
Cas (Stephen Casper)24 ago, 19:00
La investigación sobre el "sandbagging" de la IA se está volviendo más popular recientemente. En este 🧵, daré algunas razones por las que creo que no es un paradigma de investigación útil. Resumen: Creo que es un replanteamiento confuso de problemas bastante bien estudiados y previamente resueltos.
3,82K