Meiner Meinung nach ist das Konzept des "Sandbagging" irgendwie ein Sandbagging dessen, worum es beim "Sandbagging" geht (Wortspiel beabsichtigt) Das Kernproblem ist derzeit, dass KI-Entwickler sandbaggen, indem sie nicht genug tun, um das beste Verhalten hervorzurufen, nicht die KI-Modelle.
Cas (Stephen Casper)
Cas (Stephen Casper)24. Aug., 19:00
Forschung zu AI "Sandbagging" wird in letzter Zeit immer beliebter. In diesem 🧵 werde ich einige Gründe nennen, warum ich denke, dass es kein nützliches Forschungsparadigma ist. Zusammenfassung: Ich denke, es ist eine verwirrende Umformulierung von ziemlich gut untersuchten und zuvor gelösten Problemen.
3,81K