Люди кажуть, що Seed-OSS дуже хороший для довгих виходів (як і було задумано; він має чудові результати RULER і тренується для контексту 0,5 М). Це також непоганий агент SWE. Але, звичайно, 512К з базовим щільним GQA – це... багато кешу... Що тут можна зробити? Можливо, це заслуговує на зусилля громади.
2,31K