1/ 介绍Judge:Gensyn的可验证AI评估系统。 传统评估者依赖于封闭的API——不透明、默默更新且无法复现。 Judge针对现实世界输入执行预先商定的确定性AI模型,并承诺在公开场合接受挑战。
38.73K