to zawsze było błędne - ale teraz kategorycznie błędne w erze RL w weryfikowalnych dziedzinach modele dążą do prawdy i nawet wchodzą w interakcje z twardym światem zewnętrznym poprzez użycie narzędzi
David Deutsch
David Deutsch4 sie, 16:23
LLM-y są szkolone, aby naśladować wzorce językowe, a nie odkrywać lub weryfikować prawdę. Dlatego, gdy poproszone o wypowiedzenie się jako ekspert w dziedzinie, w której postrzegani eksperci mają powszechne nieporozumienie, LLM powtórzy to nieporozumienie, przyjmując rejestr i słownictwo ekspertów.
658,31K