Hienoa, että se on avopainoinen, mutta tiiviiden ja moe-mallien vertailu ja pelkkien kokonaisparametrien tarkastelu on aika epäreilua; jos katsot aktiivisia parametreja kokonaisparametrien sijaan, tilanne on toinen: - GLM 4.6 (32B): 74 % vähemmän - Minimax M2 (10B): 92 % vähemmän - K2-ajattelu (32B): 74 % vähemmän - V3.2 (37B): 70 % vähemmän Koko (sekä kokonais- että aktiivinen!) ei ole oikea mittari tässä, meillä pitäisi olla sama graafi nopeudella vllm:llä / SGLANGilla