Il mio benchmark AGI è se un modello può far ammettere a mia moglie che si sbagliava - ASI è quando lei dice scusa.
45