.@christinahkim говорит, что граница больше не в бенчмарках. Она в использовании. Оценочные баллы насыщены, но повседневная жизнь — нет. Реальный сигнал прогресса — это то, сколько людей используют ИИ для выполнения реальных задач. Вот как мы узнаем, что приближаемся к AGI.
31,81K