Ny forskning från Anthropic Fellows Program: Selektiv GradienT-maskering (SGTM).
Vi studerar hur man tränar modeller så att högriskkunskap (t.ex. om farliga vapen) isoleras i en liten, separat uppsättning parametrar som kan tas bort utan att påverka modellen i stort.
I sin första Ask Me Anything besvarar @amandaaskell dina filosofiska frågor om AI, och diskuterar moral, identitet, medvetande och mer.
Tidsstämplar:
0:00 Introduktion
0:29 Varför finns det en filosof på ett AI-företag?
1:24 Tar filosofer AI på allvar?
15:00 Filosofiska ideal kontra ingenjörsmässiga realiteter
17:00 Fattar modeller övermänskligt moraliska beslut?
6:24 Varför Opus 3 kändes speciell
9:00 Kommer modeller att oroa sig för avskrivning?
13:24 Var bor en modells identitet?
15:33 Synpunkter på modellvälfärd
17:17 Att hantera modellens lidande
19:14 Analogier och disanalogier till människans sinnen
20:38 Kan en AI-personlighet klara allt?
23:26 Påminner systemet om att patologisera normalt beteende?
24:48 AI och terapi
26:20 Kontinental filosofi i systemprompten
28:17 Tar bort räknande tecken från systemprompten
28:53 Vad gör en "LLM-viskare"?
30:18 Tankar om andra LLM-viskare
31:52 Visselblåsning
33:37 Rekommendation av skönlitteratur
Anthropics VD Dario Amodei talade idag vid New York Times DealBook Summit.
"Vi bygger en växande och enhetlig kapacitet som har enhetliga nationella säkerhetskonsekvenser, och demokratier måste komma dit först."