Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
GPT-5 vừa được phát hành. Hãy đánh giá hiệu suất của nó trong việc đạt được các khả năng phức tạp giống như AGI:
- @grok 4 (Suy nghĩ) vượt trội hơn @OpenAI GPT-5 (Cao) trong cả hai bài kiểm tra ARC-AGI-2 (lý luận phức tạp) và ARC-AGI-1 (ít yêu cầu hơn).
- Độ chính xác vượt trội của Grok 4 đi kèm với chi phí cao hơn đáng kể cho mỗi nhiệm vụ, dao động từ 2 đến 4 đô la.
- Các biến thể nhẹ hơn của GPT-5 (mini/nano) cung cấp sự cân bằng giữa hiệu suất và chi phí trên các tiêu chuẩn này.
Xin lưu ý, bài kiểm tra ARC-AGI-3 hiện đang diễn ra, và kết quả của các bài kiểm tra trên không ngụ ý sự vượt trội của mô hình.
h/t @arcprize

1,23K
Hàng đầu
Thứ hạng
Yêu thích