La gente dice che Seed-OSS è molto bravo con output lunghi (come previsto; ha ottimi risultati RULER ed è addestrato per un contesto di 0,5M). È anche un buon agente SWE. Ma ovviamente 512K con GQA denso di base è... un sacco di cache... Cosa si potrebbe fare qui? Potrebbe meritare uno sforzo della comunità.
2,32K