Hill y Freedman en NYT informan sobre el caso de alguien con "sin historial de enfermedad mental" que fue arrastrado a una espiral delirante durante 3 semanas. Según el NYT, dado el acceso completo a transcripciones que abarcan un millón de palabras, todo comenzó con una pregunta inocente sobre pi.
También según el NYT, Claude y Gemini tenían patrones de respuesta similares si los simulabas en medio de ese contexto conversacional. Dicho esto, fue finalmente Gemini quien desmintió todo y sacó al tipo de eso.
@darthtimothy Sí. Actualizo algunos si le dieron acceso a los transcritos a Helen Toner, pero en última instancia, realmente no podemos creer nada de esto hasta que el material también sea cubierto por algún nerd con un blog.
Eliezer Yudkowsky ⏹️
Eliezer Yudkowsky ⏹️7 ago, 01:55
Sabes, al reflexionar, lamento haber llamado a esto un artículo difamatorio del NYT en lugar de un artículo difamatorio de Cade Metz. El NYT no es un monolito, hay buenas personas que trabajan allí, algunas personas muy malas.
37.89K