DApp Store | Centrum Web3 pro události a hry | OKX Peněženka

Co můžu dělat s funkcí Objevujte

background background

discoveryBanners

Populární témata

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN-9,46 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Y

Jazyk a myšlení

Mamba-3 se blíží! Lepší výkon než transformátory a rychlé programátory (FWP) ()

33,69K

Výborné jsou nové Tinker-docs od @thinkymachines, které potvrzují nekonzistenci ve ztrátě GRPO. Touto problematikou jsme se zabývali v naší předchozí práci () a vyvinuli jsme robustnější metodu s podstatným zlepšením výkonu: • +12 absolutních bodů vs. GRPO • +6 absolutních bodů vs. DAPO Náš článek podrobně popisuje návrh algoritmů gradientů politik podle KL a náš repozitář poskytuje opravenou implementaci. Papír: Kód:

15,5K

Top

Hodnocení

Oblíbené

©2017 - 2025 WEB3.OKX.COM

Čeština 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

Více o OKX Peněžence

Stáhnout Akademie Informace o nás Kariéra Kontaktujte nás Podmínky poskytování služby Oznámení o ochraně osobních údajů X (dříve Twitter)

Produkt

Tokeny Swap Tržiště Vydělávejte Objevujte Budujte Průzkumník Zabezpečení

Podpora

Centrum podpory Ověření oficiálního obsahu Oznámení Rozpis poplatků na DEX Propojit s OKX Peněženka sítě Bitcoin Peněženka sítě Ethereum Peněženka sítě Solana