Tencent AI Lab представляє технологію R-Zero! Новаторська структура, що дозволяє LLM самостійно розвивати свої здібності до міркувань з нуля даних, відібраних людиною, за допомогою автономного циклу Challenger-Solver.
75,8K