Hier is een recente lezing die ik gaf over de afgelopen 6-12 maanden van AI-vooruitgang, waarom het moeilijk is om perfecte modellen te krijgen, hoe laboratoria waarschijnlijk de volgende fase van training naderen (voor agenten) en andere interessante weetjes in het redeneerlandschap. Onderwerpen: 00:00 Inleiding & de stand van het redeneren 05:50 Heuvelklimmen imperfecte evals 09:18 Technische knelpunten 13:02 Sycofantie 18:08 De Goudlokje-zone 19:28 Wat komt er nu? (hint, planning) 26:40 Q&A YouTube enz. in antwoorden. Bedankt @corbtt en @OpenPipeAI voor het hosten van mij.
Bericht (transcript + links): YouTube: Dia's:
68,01K