⚡FP8 face RL mai rapid - dar cu prețul performanței. Vă prezentăm FlashRL, prima rețetă RL open-source și funcțională care aplică INT8/FP8 pentru lansare fără a pierde performanța în comparație cu BF16! 📝 Blog: 💻 Cod:
40,61K