Hill och Freedman på NYT rapporterar om ett fall med en person som "inte har någon historia av psykisk sjukdom" och som drogs in i en vanföreställningsspiral i tre veckor. Enligt NYT, som fick full tillgång till transkriptioner som sträcker sig över en miljon ord, började det med en oskyldig fråga om pi.
Enligt NYT hade Claude och Gemini liknande svarsmönster om du simulerade att släppa dem mitt i konversationssammanhanget. Med det sagt var det i slutändan Tvillingarna som kallade det hela för skitsnack och fick killen att sluta med det.
@darthtimothy Japp. Jag uppdaterar en del om de gav Helen Toner tillgång till utskrifterna, men i slutändan kan vi inte riktigt tro på något av detta förrän materialet också täcks av någon nörd med en blogg.
Eliezer Yudkowsky ⏹️
Eliezer Yudkowsky ⏹️7 aug. 01:55
Vid närmare eftertanke ångrar jag att jag kallade detta för en NYT-smutskastningsartikel i stället för en Cade Metz-smutskastningsartikel. NYT är inte en monolit, några bra människor arbetar där, några mycket dåliga människor.
37,88K