¿Es GPT-5 un buen hito para finalmente dejar de llamar a todo "modelos" y comenzar a diferenciar entre chatbots, APIs, pesos de modelos y comparar/benchmarkear en consecuencia? No tiene sentido comparar las salidas de los chatbots (que pueden ser el resultado de docenas de pesos de modelos diferentes) contra las salidas de un solo peso de modelo, es como comparar un coche con un motor (libro de @random_walker @sayashk)
9.27K