Ludzie mówią, że Seed-OSS jest bardzo dobry w długich wynikach (zgodnie z zamierzeniem; ma świetne wyniki RULER i jest trenowany na 0,5M kontekstu). To także przyzwoity agent SWE. Ale oczywiście 512K z podstawowym gęstym GQA to… dużo pamięci podręcznej… Co można by tutaj zrobić? Może zasługuje na wysiłek społeczności.
2,32K