Масштабований нагляд – це чи не остання велика дослідницька проблема, що залишилася. Як тільки ви отримаєте незламну функцію винагороди за все, тоді ви зможете RL на все.
154,36K