## Wydajność na poziomie ludzkim jest niezbędna dla AGI kończąc wspaniałą podróż 🇸🇬, podczas której miałem okazję spotkać się z @agihippo + zobaczyć @jeffdean @quocleix @denny_zhou i innych, którzy przedstawili aktualizacje "Stan GDM" na 2025* najczęstszym tematem w naszych rozmowach jest wydajność uczenia się. czas obliczeń wnioskowania jest teraz na czołowej pozycji, ale #efektywnośćprzychodzi następnie, a ja zazwyczaj jestem o 3-6 miesięcy do przodu w porównaniu do większości, gdy mam takie przeczucia. ludzie często są zaskoczeni, a potem zazwyczaj się zgadzają, gdy rysuję linię łączącą przełomowe osiągnięcia w uczeniu się samonadzorowanym oraz RLAIF i RLVR, które są po prostu krokami w wydajności uzyskiwanej na punkt danych, a następny skok tej wydajności był oczywiście tym, co Quoc potwierdził, że Ilya również nad tym pracuje w swoim wystąpieniu, do którego odwołano się poniżej + "góra" Ilyi, którą zidentyfikował na NeurIPS. Postawiłbym trochę pieniędzy, że rozwiązaniem tego jest nowy blok/abstrakcja, która nie jest "tylko wieloma agentami" i jest bardziej podobna do testowania w czasie rzeczywistym i rozwiązywania potencjalnych hipotez modeli świata, trochę jak rozwiązywanie łamigłówki sudoku lub gra w Cluedo. to jedyny systematyczny sposób, w jaki wiem, jak zredukować proces uczenia się człowieka, gdzie możemy uczyć się koncepcji w kilku próbach z 10-20 razy mniejszą liczbą punktów danych na koncepcję niż obecny SOTA. Gdybym był badaczem, zacząłbym tutaj teraz... i byłoby to bardzo ironiczne/ciekawe, gdyby to był ostateczny triumf @ylecun.
4,18K