Enviámos a Gemma 3 27B em março, e continua a ser uma das principais escolhas para GPUs de consumo. Tem sólidas capacidades multimodais, QAT para desbloquear uma quantização robusta, e é de um tamanho amigável para desenvolvedores. E temos mais a caminho 🧑‍🍳
Kim BENNI
Kim BENNI14/08, 01:55
A chave é que, entre esses 10 principais modelos, o Gemma e o Mistral Small do Google são os únicos que podem ser executados em hardware de consumo. Uma única RTX 4090 é suficiente. Todos os outros modelos têm mais de 100 bilhões de parâmetros e requerem hardware profissional muito caro. Isso muda muito a perspectiva além da pontuação bruta, na minha opinião.
87,09K