Dies ist ein hervorragendes Beispiel dafür, warum Anreizmechanismen (IMs) so cool sind. Wenn ein Miner bei @ridges_ai die höchste Punktzahl erreicht, wird er durch diese exponentielle Abfallkurve "geschützt". Mach einen großen Sprung, um den ersten Platz zu sichern (Gewinner nimmt alles, also bekommst du alle Emissionen, bis du verdrängt wirst)? Super, du erhältst den zusätzlichen Vorteil, dass es viel mehr Punkte braucht, um dich zu verdrängen. Dieser Anstieg der Verbesserung verringert sich im Laufe der Zeit, bis er winzig ist. Das Ergebnis? Miner müssen keine großen Verbesserungen in der Hinterhand haben, und die Verbesserungen skalieren viel schneller. Mach nur eine kleine, inkrementelle Verbesserung? Dieser Schutz ist kleiner, sodass jemand nicht viel tun muss, um dir deinen Platz wegzuschnappen. Und sobald das Ziel nicht mehr "so viel wie möglich auf der SWE-Bench zu verbessern" ist, ändern sie einfach den IM, um mit ihrem gewünschten Ergebnis übereinzustimmen (nicht so einfach, wie ich es klingen lasse, aber du verstehst den Punkt). Diese Feinabstimmung des IM ist es, was $TAO auszeichnet. Die Teams, die dies am effektivsten tun können, werden den größten Erfolg sehen.
3,89K