Orang-orang mengatakan Seed-OSS sangat bagus dalam output panjang (seperti yang dimaksudkan; ia memiliki hasil RULER yang bagus dan dilatih untuk konteks 0,5 juta). Ini juga agen SWE yang layak. Tapi tentu saja 512K dengan GQA padat dasar adalah... banyak cache... Apa yang bisa dilakukan di sini? Itu mungkin layak mendapat upaya masyarakat.
2,14K