Czy GPT-5 to dobry kamień milowy, aby w końcu przestać nazywać wszystko "modelami" i zacząć różnicować między chatbotami, API, wagami modeli i porównywać/benchmarkować odpowiednio? Nie ma sensu porównywać wyników chatbotów (które mogą być wynikiem dziesiątek różnych wag modeli) z wynikami pojedynczej wagi modelu, to tak, jakby porównywać samochód z silnikiem (książka od @random_walker @sayashk)
9,3K