DApp Mağazası | Etkinlikler ve Oyunlar için Web3 Merkezi

Trend Olan Konular

@Anthropic'nin son sistem kartındaki dürüstlüğünü takdir ediyorum, ancak içeriği bana şirketin gelişmiş yapay zeka modellerinin dağıtımında sorumlu davranacağına dair güven vermiyor: -Opus 4.6'nın otonom AI R&D-4 eşiğini aşıp aşmadığını belirlemek için öncelikle bir iç ankete dayandılar (ve bu nedenle Sorumlu Ölçeklendirme Politikaları kapsamında yayımlanması için daha güçlü önlemler gerekecekti). Bu, tarafsız bir üçüncü tarafın dış bir anketi bile değil, daha çok Anthropic çalışanların bir anketiydi. -16/5 iç anket katılımcıları model yayını için daha güçlü önlemlerin gerekebileceğini ilk olarak değerlendirdiğinde, Anthropic özellikle bu çalışanlarla iletişime geçip "görüşlerini netleştirmelerini" istedi. Diğer 11/16 katılımcıları için benzer bir takip sürecinden bahsetmiyorlar. Sistem kartında, bunun anket sonuçlarında nasıl bir önyargı yaratabileceği konusunda bir tartışma yoktur. -Anketlere güvenmelerinin nedeni, mevcut yapay zeka AR-GE değerlendirmelerinin doygun olması. Bazıları yapay zeka ilerlemesinin o kadar hızlı olduğunu iddia edebilir ki, henüz daha gelişmiş nicel değerlendirmeler yok ama yapay zeka laboratuvarlarını yüksek bir standartta tutabiliriz ve tutmalıyız. Ayrıca, diğer laboratuvarlarda doygun olmayan gelişmiş yapay zeka Ar-Ge değerlendirmeleri var. Örneğin, OpenAI'nin OPQA kıyaslaması var; bu kıyaslama, yapay zeka modellerinin OpenAI araştırma ekiplerinin karşılaştığı ve ekibin çözmesi bir günden fazla süren gerçek iç sorunları çözme yeteneğini ölçer. Opus 4.6'nın aslında uzaktan giriş seviyesi yapay zeka araştırmacısı seviyesinde olduğunu düşünmüyorum ve yayınlamasının tehlikeli olduğunu da düşünmüyorum. Ancak Sorumlu Ölçeklendirme Politikası'nın amacı, işler ciddileşmeden önce kurumsal güç ve iyi alışkanlıklar geliştirmektir. İç anketler, özellikle Anthropic'in yürüttüğü şekilde, nicel değerlendirmelerin sorumlu bir yerine geçmez.

@Anthropic Sistem kartı burada:

308

En İyiler

Sıralama

Takip Listesi