.@christinahkim sagt, dass die Grenze nicht mehr Benchmarks sind. Es ist die Nutzung. Eval-Werte sind gesättigt, aber das tägliche Leben nicht. Das echte Signal für Fortschritt ist, wie viele Menschen KI nutzen, um echte Dinge zu erledigen. So werden wir wissen, dass wir der AGI näher kommen.
32,81K