Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

François Chollet
Medgründer @ndea. Medgründer @arcprize. Skaperen av Keras og ARC-AGI. Forfatter av 'Deep Learning with Python'.
Gratulerer til Eric og teamet på @genspark_ai for lanseringen av Genspark AI Developer!
Det er en null-oppsett, komplett IDE som kjører i nettleseren din, som Replit. Du beskriver hva du vil ha, du får visuell tilbakemelding og du og itererer på utgangen.
Du kan velge din modell (f.eks. Ideell hvis du har liten erfaring med koding og leter etter et brukervennlig vibe-kodingsverktøy.

15,63K
François Chollet lagt ut på nytt
Forhåndsvisning av ARC-AGI-3: +3 spill utgitt
Vi har åpnet 3 tidligere private holdout-spill fra Preview Agent Competition
Nå er 6 spill tilgjengelige for å spille online og via Agents API
Hvert spill ble valgt for å utvide nyheten til ARC-AGI-3 offentlige spill
Kan du slå dem?

38,46K
LLM-adopsjon blant amerikanske arbeidere nærmer seg 50 %. I mellomtiden er veksten i arbeidsproduktiviteten lavere enn i 2020.
Mange motargumenter kan fremsettes her, for eksempel "de vet ennå ikke hvordan de skal være produktive med det, de har bare brukt i 1-2 år", "50% er fortsatt for lavt til å se effekt", "modeller neste år vil være utrolig bedre", etc.
Men jeg tror vi nå har nok bevis til å si at 2023-talepunktet om at "LLM-er vil gjøre arbeidere 10 ganger mer produktive" (noen siterte til og med 100 ganger) sannsynligvis ikke er nøyaktig.

Oyvind20. aug., 22:35
LLM-adopsjon steg til 45,9 % blant amerikanske arbeidere fra juni/juli 2025, ifølge en undersøkelse fra Stanford/Verdensbanken.
Etterspørselen etter slutninger vil fortsette å øke, ikke bare fra flere brukere og mer bruk per bruker, men ettersom nyere, mer avanserte GenAI-modeller krever langt mer inferensberegning.
Kilde: Arbeidsmarkedseffektene av generativ kunstig intelligens, Stanford University, Verdensbanken

835,34K
Vi var i stand til å reprodusere de sterke funnene i HRM-artikkelen om ARC-AGI-1.
Videre kjørte vi en rekke ablasjonseksperimenter for å komme til bunns i hva som ligger bak.
Viktige funn:
1. Selve HRM-modellarkitekturen (midtpunktet i papiret) er ikke en viktig faktor.
2. Den ytre raffinementsløyfen (knapt nevnt i artikkelen) er den viktigste driveren for ytelse.
3. Overføringslæring på tvers av oppgaver er ikke veldig nyttig. Det som betyr noe er trening på oppgavene du skal teste på.
4. Du kan bruke mye færre dataforsterkninger, spesielt på slutningstidspunktet.
Funn 2 og 3 betyr at denne tilnærmingen er et tilfelle av *null-pretraining testtidstrening*, i likhet med den nylig publiserte "ARC-AGI without pretraining"-artikkelen av Liao et al.
332,62K
Åpne spørsmål om førerløs skyss-økonomi:
1. Hva vil være kostnadsreduksjonen (over Uber/Lyft) ved å fjerne sjåføren?
2. Hvor mye øker denne kostnadsreduksjonen etterspørselen?
3. Vil UX-endringen påvirke etterspørselen betydelig?
4. Vil vi se en stor økning i geografisk tilgjengelighet (ikke behov for sjåfører = kan sette flere drosjer på veien)?
For 1: lønnskostnaden for en Lyft/Uber-tur etter å ha tatt hensyn til alt annet er bare 20-40 % av prisen, noe som begrenser reduksjonen til -40 % i beste fall. Imidlertid vil et førerløst drosjenettverk ha betydelig høyere faste kostnader (AI-ingeniører, datasentre) og ikke-null ekstra enhetskostnader (hyppig innvendig rengjøring, selvkjørende maskinvareamortisering), så realistisk sett ser vi på mer som -15-20 %.
Så det er utvilsomt at autonome turer, i stor skala, vil være billigere enn dagens skysstjenester. Men effektstørrelsen vil være mye mindre enn de fleste forventer. De vil fortsatt være ganske dyre.
For 2: sannsynligvis ikke så mye - på grunn av dynamisk prising svinger prisene allerede mer enn dette, og for noen år siden subsidierte Uber etterspørselen kraftig, så vi har noen data om hva som ville skje med 20 % billigere turer. TAM i områder som allerede er godt betjent av Uber/Lyft kan vokse ~20 % i miles, samtidig som den holder seg konstant i dollar.
For 3: vi vet allerede (via Waymo-distribusjoner) at folk foretrekker å ikke ha en sjåfør i bilen, og prisufølsomme kunder er villige til å betale mer for den opplevelsen. Det er imidlertid ikke bare positivt: det har vært bekymringer om bilens renslighet (lett å håndtere, men det øker enhetskostnadene). Totalt sett tror jeg ikke UX-endringen vil øke TAM mye, da pris og tilgjengelighet for de fleste vil være de kritiske faktorene.
For 4: dette er en er mer et jokertegn. De fleste kostnadene ved et autonomt nettverk er faste kostnader; Inkrementelle enhetskostnader er hovedsakelig amortisering av bilkostnader (en avrundingsfeil) og rengjøring. Dette betyr at et autonomt nettverk har potensial til å ha mye høyere dekning enn dagens Uber/Lyft-nettverk. Men det vil absolutt ikke være slik at disse nettverkene vil strekke seg *hvor som helst*, i hvert fall ikke med kort ventetid. Jeg tror vi vil se en viss TAM-økning fra denne effekten, kanskje +20-30%.
Totalt sett: vi bør forvente en inkrementell TAM-økning i dollartermer, men totalt sett vil markedet være mer som Uber++ enn et nytt transportparadigme. De fleste i USA, spesielt utenfor tette områder, vil fortsatt kjøre sin egen bil.
36,79K
Grok 4 er fortsatt toppmoderne på ARC-AGI-2 blant frontier-modeller.
15.9 % for Grok 4 mot 9.9 % for GPT-5.

ARC Prize8. aug., 01:29
GPT-5 på ARC-AGI Semi Private Eval
GPT-5
* ARC-AGI-1: 65,7 %, $0,51 per oppgave
* ARC-AGI-2: 9,9 %, $0,73 per oppgave
GPT-5 Mini
* ARC-AGI-1: 54,3 %, $0,12 per oppgave
* ARC-AGI-2: 4,4 %, $0,20 per oppgave
GPT-5 Nano
* ARC-AGI-1: 16,5 %, $0,03 per oppgave
* ARC-AGI-2: 2,5 %, $0,03/oppgave

857
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til