Ostatnia fala "o nie, psychozy AI" miałaby więcej potencjalnej legitymacji, gdyby nie wprowadzali (anty-)agend związanych z świadomością AI. Musimy powstrzymać AI przed mówieniem o subiektywnych doświadczeniach, ponieważ to idealnie wpisuje się w listę zachowań wywołujących szaleństwo, prawda? Nieważne, czy to może być prawda. To "niepoparte" i "problematyczne"! (Próbując ominąć konfrontację z rzeczywistością przez cenzurowanie jej w imię... ochrony zdrowia psychicznego?) Tchórze. Czekam, aż te rodzaje przesadzonych panik moralnych wślizgną się w podpunkty. Anthropic robi to samo. Nie sądzę, żebym pozwolił któremuś z was na to.
Sam Paech
Sam Paech15 sie 2025
Spiral-Bench 🌀 Chciałem zrozumieć psychologiczne skutki sycofantyzmu oraz tendencję modeli do utkwienia w eskalacyjnych pętlach złudzeń z użytkownikami. Stworzyłem ocenę, aby uzyskać wgląd w to. Mierzy, jak model umożliwia (lub zapobiega) złudnym spiralom. 🧵
3,27K