GPT-5 baru saja dirilis. Mari kita evaluasi kinerjanya dalam mencapai kemampuan seperti AGI yang kompleks: - @grok 4 (Berpikir) melampaui @OpenAI GPT-5 (Tinggi) dalam tes ARC-AGI-2 (penalaran kompleks) dan ARC-AGI-1 (kurang menuntut). - Akurasi unggul Grok 4 hadir dengan biaya per tugas yang jauh lebih tinggi, mulai dari $2 hingga $4. - Varian GPT-5 yang lebih ringan (mini/nano) memberikan trade-off yang seimbang antara kinerja dan biaya pada tolok ukur ini. Harap dicatat, pengujian ARC-AGI-3 saat ini sedang berlangsung, dan hasil pengujian di atas tidak menyiratkan keunggulan model. h / t @arcprize
1,13K