OLMo 2 on SOTA web uudelleenkirjoittaja??
Pratyush Maini @ICLR'25
Pratyush Maini @ICLR'2518.8. klo 22.57
1/Esikoulutus törmää dataseinään; Pelkkä raakaverkkodatan skaalaaminen johtaa tuottojen vähenemiseen. Tänään @datologyai jakaa BeyondWebin, synteettisen datan lähestymistavan ja kaikki opit sen skaalaamisesta biljooniksi tokeneiksi🧑🏼 🍳 - 3B LLM:t päihittävät 8B-mallit🚀 - Pareto-raja-arvo suorituskyvyssä
46,23K