Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
@Anthropic'nin son sistem kartındaki dürüstlüğünü takdir ediyorum, ancak içeriği bana şirketin gelişmiş yapay zeka modellerinin dağıtımında sorumlu davranacağına dair güven vermiyor:
-Opus 4.6'nın otonom AI R&D-4 eşiğini aşıp aşmadığını belirlemek için öncelikle bir iç ankete dayandılar (ve bu nedenle Sorumlu Ölçeklendirme Politikaları kapsamında yayımlanması için daha güçlü önlemler gerekecekti). Bu, tarafsız bir üçüncü tarafın dış bir anketi bile değil, daha çok Anthropic çalışanların bir anketiydi.
-16/5 iç anket katılımcıları model yayını için daha güçlü önlemlerin gerekebileceğini ilk olarak değerlendirdiğinde, Anthropic özellikle bu çalışanlarla iletişime geçip "görüşlerini netleştirmelerini" istedi. Diğer 11/16 katılımcıları için benzer bir takip sürecinden bahsetmiyorlar. Sistem kartında, bunun anket sonuçlarında nasıl bir önyargı yaratabileceği konusunda bir tartışma yoktur.
-Anketlere güvenmelerinin nedeni, mevcut yapay zeka AR-GE değerlendirmelerinin doygun olması. Bazıları yapay zeka ilerlemesinin o kadar hızlı olduğunu iddia edebilir ki, henüz daha gelişmiş nicel değerlendirmeler yok ama yapay zeka laboratuvarlarını yüksek bir standartta tutabiliriz ve tutmalıyız. Ayrıca, diğer laboratuvarlarda doygun olmayan gelişmiş yapay zeka Ar-Ge değerlendirmeleri var. Örneğin, OpenAI'nin OPQA kıyaslaması var; bu kıyaslama, yapay zeka modellerinin OpenAI araştırma ekiplerinin karşılaştığı ve ekibin çözmesi bir günden fazla süren gerçek iç sorunları çözme yeteneğini ölçer.
Opus 4.6'nın aslında uzaktan giriş seviyesi yapay zeka araştırmacısı seviyesinde olduğunu düşünmüyorum ve yayınlamasının tehlikeli olduğunu da düşünmüyorum. Ancak Sorumlu Ölçeklendirme Politikası'nın amacı, işler ciddileşmeden önce kurumsal güç ve iyi alışkanlıklar geliştirmektir. İç anketler, özellikle Anthropic'in yürüttüğü şekilde, nicel değerlendirmelerin sorumlu bir yerine geçmez.

@Anthropic Sistem kartı burada:
308
En İyiler
Sıralama
Takip Listesi
