As pessoas dizem que o Seed-OSS é muito bom em saídas longas (como pretendido; tem ótimos resultados no RULER e é treinado para 0,5M de contexto). Também é um agente SWE decente. Mas, claro, 512K com GQA densa básica é... muito cache... O que poderia ser feito aqui? Pode merecer um esforço da comunidade.
2,47K