1/ 介紹Judge:Gensyn的可驗證AI評估系統。 傳統評估者依賴於封閉的API——不透明、默默更新且無法復現。 Judge針對現實世界輸入執行預先商定的確定性AI模型,並承諾在公開場合接受挑戰。
35.32K