GPT-5 właśnie został wydany. Oceńmy jego wydajność w osiąganiu złożonych zdolności podobnych do AGI: - @grok 4 (Myślenie) przewyższa @OpenAI GPT-5 (Wysoki) zarówno w testach ARC-AGI-2 (złożone rozumowanie), jak i ARC-AGI-1 (mniej wymagające). - Wyższa dokładność Grok 4 wiąże się z znacznie wyższymi kosztami za zadanie, wynoszącymi od 2 do 4 dolarów. - Lżejsze warianty GPT-5 (mini/nano) oferują zrównoważony kompromis między wydajnością a kosztami w tych benchmarkach. Proszę zauważyć, że test ARC-AGI-3 jest obecnie w toku, a wyniki powyższych testów nie implikują wyższości modelu. h/t @arcprize
1,21K