GPT-5 vừa được phát hành. Hãy đánh giá hiệu suất của nó trong việc đạt được các khả năng phức tạp giống như AGI: - @grok 4 (Suy nghĩ) vượt trội hơn @OpenAI GPT-5 (Cao) trong cả hai bài kiểm tra ARC-AGI-2 (lý luận phức tạp) và ARC-AGI-1 (ít yêu cầu hơn). - Độ chính xác vượt trội của Grok 4 đi kèm với chi phí cao hơn đáng kể cho mỗi nhiệm vụ, dao động từ 2 đến 4 đô la. - Các biến thể nhẹ hơn của GPT-5 (mini/nano) cung cấp sự cân bằng giữa hiệu suất và chi phí trên các tiêu chuẩn này. Xin lưu ý, bài kiểm tra ARC-AGI-3 hiện đang diễn ra, và kết quả của các bài kiểm tra trên không ngụ ý sự vượt trội của mô hình. h/t @arcprize
1,23K