DApp Store | Hub Web3 pentru evenimente și jocuri

Subiecte populare

Apreciez onestitatea lui @Anthropic în cea mai recentă fișă de sistem, dar conținutul nu îmi dă încredere că compania va acționa responsabil prin implementarea modelelor avansate de inteligență artificială: -S-au bazat în principal pe un sondaj intern pentru a determina dacă Opus 4.6 a depășit pragul lor autonom de R&D-4 pentru AI (și, prin urmare, ar necesita măsuri de protecție mai stricte pentru a fi lansat în cadrul Politicii lor de Scalare Responsabilă). Nici măcar nu a fost un sondaj extern al unei terțe părți imparțiale, ci mai degrabă un sondaj al angajaților Anthropic. -Când respondenții interni din 16 din 5 au făcut inițial o evaluare care sugera că ar putea fi necesare măsuri de protecție mai stricte pentru lansarea modelului, Anthropic a urmărit în mod specific acei angajați și le-a cerut să "clarifice punctele de vedere". Ei nu menționează o urmărire similară pentru ceilalți respondenți din 11/16. Nu există nicio discuție în cartea sistemului despre cum acest lucru ar putea crea părtinire în rezultatele sondajului. -Motivul pentru care se bazează pe sondaje este că evaluările lor existente de cercetare și dezvoltare AI sunt saturate. Unii ar putea argumenta că progresul AI a fost atât de rapid încât este de înțeles că nu au încă evaluări cantitative mai avansate, dar putem și ar trebui să ținem laboratoarele AI la un nivel ridicat. De asemenea, alte laboratoare au evaluări avansate de cercetare și dezvoltare AI care nu sunt saturate. De exemplu, OpenAI are benchmark-ul OPQA, care măsoară capacitatea modelelor AI de a rezolva probleme interne reale întâlnite de echipele de cercetare OpenAI și care au necesitat mai mult de o zi pentru a fi rezolvate. Nu cred că Opus 4.6 este de fapt la nivelul unui cercetător AI de la distanță, de nivel de intrare, și nici nu cred că este periculos să-l lansezi. Dar scopul unei Politici de Scalare Responsabilă este de a construi forță instituțională și obiceiuri bune înainte ca lucrurile să devină serioase. Sondajele interne, mai ales că Anthropic le-a administrat, nu reprezintă un substitut responsabil pentru evaluările cantitative.

@Anthropic Card de sistem este aici:

299

Limită superioară

Clasament

Favorite