GPT-5 on juuri julkaistu. Arvioidaan sen suorituskykyä monimutkaisten AGI:n kaltaisten ominaisuuksien saavuttamisessa: - @grok 4 (ajattelu) ylittää @OpenAI GPT-5:n (korkea) sekä ARC-AGI-2 (monimutkainen päättely) että ARC-AGI-1 (vähemmän vaativa) testeissä. - Grok 4:n ylivoimainen tarkkuus tuo mukanaan huomattavasti korkeammat tehtäväkohtaiset kustannukset, jotka vaihtelevat 2–4 dollarista. - Kevyemmät GPT-5-versiot (mini/nano) tarjoavat tasapainoisen kompromissin suorituskyvyn ja kustannusten välillä näissä vertailuarvoissa. Huomaa, että ARC-AGI-3-testi on parhaillaan käynnissä, eivätkä yllä olevien testien tulokset tarkoita mallin paremmuutta. h/t @arcprize
1,27K