Het meten van denkefficiëntie in redeneermodellen: de ontbrekende benchmark We hebben het tokengebruik gemeten over redeneermodellen: open modellen geven 1,5-4x meer tokens weer dan gesloten modellen bij identieke taken, maar met enorme variatie afhankelijk van het type taak (tot 10x bij eenvoudige vragen). Deze verborgen kosten maken vaak de prijsvoordelen per token teniet. Token efficiëntie zou een primaire doelstelling moeten worden naast nauwkeurigheidsbenchmarks, vooral gezien niet-rederende gebruiksgevallen. Lees de grondige beoordeling van redeneerefficiëntie over het landschap van open en gesloten modellen in onze nieuwste blogpost in samenwerking met onze onderzoeker in residentie, Tim. Bekijk hier meer van hun werk:
22,51K