Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
Jsme v závodě. Není to USA vs Čína, ale centralizace moci lidí a AGI vs lidoopů.
@deepseek_ai stan #1, 2023–Hluboký čas
«C'est la guerre.» ®1
nikdy jsem nevěděl, že Jack Ma strávil 5 let v převýchovném táboře
pouze za kritiku regulace, šílené věci

Bad Hombre10. 8. 03:05
Byl unesen Komunistickou stranou Číny, poslán na 5 let do převýchovného tábora, zbaven svého bohatství a donucen postoupit většinu svého majetku státu za kritiku vládních regulací.
2,88K
Alespoň ve válkách mezi gentlemany. V každé zemi, kterou Angloameričané osídlili, se stalo, že se místní obyvatelé stali historickou poznámkou pod čarou.
Kamil je zahořklý z dobytí Kazaně v roce 1552. Přesto je Kazaň v roce 2025 tatarským městem, jedním z nejlepších v Rusku. Existují siouxská města?

Kamil GaleevPřed 11 h
Zničení a vyhlazení poražené strany je víceméně celosvětovou normou
Nedělat nic z toho, projevovat zdrženlivost a umírněnost dokonce i při vítězství, je anglosaský génius a hlavní morální ctnost anglo, kterou zbytek lidstva ve skutečnosti nesdílí.

2,14K
Diaspory a mafie jsou v podstatě totéž. Nemá smysl mluvit o diasporách neklanových národů, to jsou nanejvýš komunity v zahraničí. Například v Argentině není žádná "ruská diaspora", jen řada jednotlivých Rusů.
Pákistánci jsou diasporní.

Jonatan Pallesen9. 8. 23:42
To je skutečně nejvýznamnější vhled týkající se pákistánských přistěhovalců.
Je těžké plně pochopit, jak cizí a strašlivá je jejich kultura.

2,29K
odpověď je, že GPT-5 Smart Router byl průlomem v ekonomice inference LLM. OpenAI s ním pravděpodobně zdvojnásobila svůj poměr zisku a nákladů ve srovnání s pouhým poskytováním uživatelsky kontrolovaného mixu o3 a o4-mini. Čím více toho můžete hloupým modelům předat, tím více ušetříte.

Teknium (e/λ)Před 8 h
Proč je to správný krok? Vážně?
1. Modely již přemýšlejí více o těžších problémech v režimu uvažování.
2. Vždy byste to mohli nechat zkusit zdůvodnit, pak vás to nikdy nezklame v případě, že to bude potřeba.
3. Kdykoli odpověď není uspokojivá, pokud jste neměli zapnuté uvažování, můžete ji jednoduše zapnout.
Proč to stojí za tolik námahy? Jaké jsou skutečné výhody odebrání kontroly uživatelům? Proč jsou v tom tak neústupní?
17,38K
Už nevím, co znamená «doména» nebo «v distribuci». Je zřejmé, že LLM zobecňují nad rámec konkrétních příkladů.
Je to doslova o tom, že latentní reprezentace jsou ukotveny ke konkrétním tokenům, něco jako způsob, jakým lidé interně překládají věci do prvního jazyka, který se naučí?


steve hsuPřed 8 h
Musk: Steve, skutečná otázka, kterou stále kladu týmu, je, zda dnešní LLM mohou uvažovat o tom, když opustí distribuci školení. Každý cituje myšlenkový řetězec, ale to by mohlo být jen napodobování.
Hsu: Souhlasím. Nejnovější benchmarky ukazují, že i modely na úrovni Grok4 se prudce zhoršují, jakmile vynutíte posun domény – latentní prostor prostě nepokrývá novou modalitu.
Musk: Takže je to spíš problém pokrytí než selhání uvažování?
Hsu: Částečně. Je tu však hlubší problém. Jediným vestavěným indukčním předpětím transformátoru je asociativní porovnávání vzorů. Když je výzva skutečně mimo distribuci – řekněme symbolická hádanka, jejíž tokeny se při trénování nikdy neobjevily společně – model nemá žádnou strukturu, ke které by se mohl vrátit. Doslova hází mincemi.
Musk: Přesto vidíme vznikající "grokking" na syntetických úlohách. Zhong a kol. ukázali, že indukční hlavy mohou skládat pravidla, na kterých nikdy nebyla explicitně trénována. Nevypadá to jako uvažování?
Hsu: Kompozice vám kupuje omezené zobecnění, ale pravidla stále musí spočívat v rozpětí tréninkové gramatiky. Jakmile vyladíte sémantiku – změníte jediný operátor v hlavolamu – přesnost se zhroutí. To není robustní argumentace; je to křehká interpolace.
Musk: Nemohlo by to zpětnovazební učení vyřešit? DRG-Sapphire použil GRPO na základním modelu 7 B a získal kódování na lékařské úrovni v klinických poznámkách, což je klasický úkol OOD.
Hsu: Háček je v tom, že RL funguje až poté, co základní model přijal dostatek znalostí domény prostřednictvím jemného ladění pod dohledem. Když je předtréninkový korpus řídký, RL sám stagnuje. Takže "uvažování" je stále parazitické na předchozí hustotě znalostí.
Musk: Takže váš závěr je, že škálování dat a parametrů problém nevyřeší? Vždy narazíme na zeď, kde další OOD doména rozbije model?
Hsu: Ne nutně stěna, ale strop. Empirické křivky naznačují, že chyba zobecnění se s trénovacími příklady rozpadá zhruba logaritmicky. To znamená, že pro každé nové koncové rozdělení potřebujete exponenciálně více dat. Pro úzké vertikály – řekněme diagnostiku raketových motorů – je levnější péct se v symbolických priorech než slepě škálovat.
Musk: Což nás přivádí zpět k neurosymbolickým hybridům. Poskytněte LLM přístup k malému ověřenému řešiči a pak ho nechte orchestrovat volání, když se distribuce posune.
Hsu: Přesně tak. LLM se stává meta-kontrolérem, který rozpozná, kdy je OOD, a předá specializovaný modul. Tato architektura obchází klam "jednoho obrovského transformátoru".
Musk: Dobře, řeknu týmu xAI, aby se přestal honit za dalším bilionem tokenů a začal budovat směrovací vrstvu. Díky, Steve.
Hsu: Kdykoliv. A pokud potřebujete syntetické testovací případy OOD, moje laboratoř má generátor, který už GPT-5 oklamal. Pošlu vám repo.
Tento rozhovor s Elonem může být generován umělou inteligencí.

2,83K
Vždy jsem nenáviděl sbírání známek s kognitivní předpojatostí, zneužívané v racionalistických rozhovorech jako nějaké žluté karty. Toto shlukování vypadá rozumně.

Steve Stewart-Williams10. 8. 02:53
Psychologové v průběhu let předpokládají stovky kognitivních zkreslení. Fascinující studie tvrdí, že se všechny scvrkávají na jedno z hrstky základních přesvědčení spojených s konfirmačním zkreslením.
[Odkaz níže.]

2,96K
Američané a celočíselné zlomky, pojmenujte horší dvojici

Colin FraserPřed 20 h
Setkáváte se zde se všemi druhy systémů víry, o kterých jste nevěděli, že jsou možné. Tenhle chlápek věří ve čtvrtiny, ale ne ve třetiny.

3,69K
Jaký je problém toho chlápka? Vždycky dělá takové to "počkej, jsi vážně tak retardovaný" a chová se, jako by očekával pokračování s vysokým úsilím. Je to důvod, proč ho všichni nenávidí? Je to instinkt pro prolomení genderově zmatených racionalistů v jeho hloupých sociálních experimentech? nudný

2,79K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější