¿Es GPT-5 un buen hito para finalmente dejar de llamar a todo "modelos" y empezar a diferenciar entre chatbots, APIs, pesos de modelo y comparar/benchmark de acuerdo a ello? No tiene sentido comparar las salidas de los chatbots (que pueden ser el resultado de docenas de pesos de modelo diferentes) con las salidas de un solo peso de modelo, es como comparar un coche con un motor (libro de @random_walker @sayashk)
9,32K