⚡FP8 tekee LL:stä nopeamman – mutta suorituskyvyn kustannuksella. Esittelemme FlashRL:n, ensimmäisen avoimen lähdekoodin ja toimivan RL-reseptin, joka käyttää INT8/FP8:aa käyttöönottoon menettämättä suorituskykyä BF16:een verrattuna! 📝 Blogi: 💻 Koodi:
40,59K