As pessoas dizem que o Seed-OSS é muito bom em saídas longas (como pretendido; tem ótimos resultados RULER e é treinado para contexto de 0,5M). É também um agente SWE decente. Mas é claro que 512K com GQA denso básico é... muito cache... O que poderia ser feito aqui? Pode merecer esforço comunitário.
2,47K