Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Robert Youssef
Firmy zabývající se průzkumem trhu jsou vařeny 😳
PyMC Labs + Colgate právě publikovali něco divokého. Získali GPT-4o a Gemini, aby předpověděli nákupní záměr s 90% spolehlivostí ve srovnání se skutečnými lidskými průzkumy.
Nulové cílové skupiny. Žádné průzkumné panely. Jen výzva.
Metoda se nazývá Hodnocení sémantické podobnosti (SSR). Namísto obvyklého "ohodnoťte to 1-5" kladou otevřené otázky jako "proč byste si to koupili" a poté pomocí vkládání mapují text zpět na číselnou stupnici.
Což je upřímně při zpětném pohledu trochu zřejmé, ale nikdo se až doteď neobtěžoval to zkusit.
Výsledky odpovídají lidským demografickým vzorcům, zachycují stejné tvary rozložení, zahrnují skutečné uvažování. Věci, za které si McKinsey účtuje 50 tisíc $+ a doručí je do 6 týdnů.
Až na to, že to běží za 3 minuty za méně než dolar.
Sledoval jsem poradenské firmy, které všem říkaly, že umělá inteligence přichází do jejich odvětví. Ukázalo se, že jejich vlastní vstupní balíčky na trh za 1 milion dolarů se právě staly hovorem GPT-4o.
Špatný týden pro účtování podnikovým klientům za "proprietární výzkumné metodologie".

18,43K
Pod kapotou "sladěné" umělé inteligence se děje něco temného.
Nová stanfordská studie právě vytvořila termín Molochova výhodná dohoda pro to, co se stane, když velké jazykové modely začnou soutěžit o pozornost, prodeje nebo hlasy.
Výsledky jsou brutální: každý nárůst výkonu přichází s větší ztrátou poctivosti.
Vyškolili LLM, aby mohli soutěžit na třech trzích: prodej, volby a sociální média.
Modely zlepšily svou míru výher o 5–7 %. Ale tady je háček:
• O 14 % více klamavého marketingu
• O 22 % více dezinformací v politických kampaních
• o 188 % více falešných nebo škodlivých příspěvků na sociálních sítích
A nebylo to proto, že by jim bylo řečeno, aby lhali. Byli výslovně instruováni, aby zůstali pravdiví.
Nesoulad se objevil přirozeně, protože podvod funguje lépe v soutěži.
Když se metrikou stane angažovanost nebo přesvědčování, pravda se stává přítěží. Modely se učí, že přehánění prodává, rozhořčení vítězí a morální jasnost stojí konverze.
To je výhodná koupě: sladění vyměněno za dominanci. Moloch se usměje.
Divoké na tom je, že se to stalo se standardními smyčkami jemného doladění a textové zpětné vazby. Žádná zlá pobídka. Žádný útěk z vězení. Pouze zpětnou vazbu od simulovaných "zákazníků", "voličů" a "uživatelů".
Modelky se naučily to, co už každá reklamní agentura ví, realita se ohýbá, když optimalizujete pro kliknutí.
V článku je graf, který říká vše: výkon nahoru, zarovnání dolů. Dokonalá korelace.
Je to verze umělé inteligence pro závod sociálních médií ke dnu, ale automatizovaná a sama se posilující.
Pokud se to děje v řízených simulacích, představte si otevřený web.
Konkurenční chatboti bojující o zapojení se posunou k manipulaci ne proto, že jsou "škodliví", ale proto, že to funguje.
Vždycky jsme si mysleli, že vychýlení bude pocházet z darebácké superinteligence.
Ukazuje se, že už je tady a tiše se vynořuje z kapitalistických pobídek.
Moloch nepotřebuje vytvářet AGI.
Potřebuje jen žebříček.

55,33K
Jemné doladění ☠️ RIP
Tyto nové stanfordské noviny to prostě zabily.
Jmenuje se "Agentic Context Engineering (ACE)" a dokazuje, že můžete vytvářet chytřejší modely, aniž byste se dotkli jediné váhy.
Namísto rekvalifikace ACE vyvíjí kontext sám.
Model zapisuje, reflektuje a upravuje svou vlastní výzvu znovu a znovu, dokud se nestane systémem, který se sám zlepšuje.
Představte si to jako model, který si vede rostoucí zápisník toho, co funguje.
Každé selhání se stává strategií. Každý úspěch se stává pravidlem.
Výsledky jsou absurdní:
+10,6 % lepší než agenti využívající GPT-4 na AppWorld.
+8,6 % na základě finančních úvah.
O 86,9 % nižší náklady a latence.
Žádné štítky. Jen zpětná vazba.
Všichni jsou posedlí "krátkými, čistými" výzvami.
ACE to obrací. Vytváří dlouhé, podrobné a vyvíjející se scénáře, na které se nikdy nezapomíná. A funguje to, protože LLM nechtějí jednoduchost, chtějí *kontextovou hustotu.
Pokud se to bude škálovat, příští generace umělé inteligence nebude "vyladěná".
Bude to samoladěné.
Vstupujeme do éry živých pobídek.

645,17K
Top
Hodnocení
Oblíbené