Nejlepší AI noviny týdne (28. července - 3. srpna): - GEPA - Graf-R1 - AlfaZemě - Samo-vyvíjející se agenti - Model hierarchického uvažování - Účinné mechanismy pozornosti - Optimalizace politik geometrického průměru Přečtěte si více:
1. Základy AlphaEarth AlphaEarth Foundations (AEF) představuje geoprostorový model základů, který se učí kompaktní, časově spojité pole zemského povrchu.
Google DeepMind
Google DeepMind30. 7. 2025
Náš nový model umělé inteligence AlphaEarth Foundations mapuje planetu v úžasných detailech. 🌏🔍 Vědci nyní budou moci sledovat dopad odlesňování, sledovat zdraví plodin a další – díky našim novým datovým souborům výrazně rychleji. 🧵
2. Geometrický průměr optimalizace politiky Představuje stabilizovanou alternativu ke skupinové relativní optimalizaci politik (GRPO), která je široce používána ke zlepšení schopností uvažování ve velkých jazykových modelech prostřednictvím zpětnovazebního učení.
3. GEPA Zavádí nový optimalizátor GEPA, který adaptivně vylepšuje výzvy pro složené systémy umělé inteligence pomocí reflexe přirozeného jazyka a vyhledávání založeného na Paretovi.
Lakshya A Agrawal
Lakshya A Agrawal29. 7. 2025
How does prompt optimization compare to RL algos like GRPO? GRPO needs 1000s of rollouts, but humans can learn from a few trials—by reflecting on what worked & what didn't. Meet GEPA: a reflective prompt optimizer that can outperform GRPO by up to 20% with 35x fewer rollouts!🧵
5. Graf-R1 Představuje nový rámec RAG, který překračuje tradiční jednorázové nebo blokové vyhledávání integrací znalostí strukturovaných grafem, agentické víceotáčkové interakce a RL.
elvis
elvis30. 7. 2025
Graf-R1 Nový framework RAG právě vypadl! Kombinuje agenty, GraphRAG a RL. Zde jsou mé poznámky:
7. Kde zobrazit ukázky ve výzvě? Zavádí zkreslení DPP, nový druh poziční citlivosti ve velkých jazykových modelech (LLM), kde umístění demonstrací ve výzvě významně ovlivňuje přesnost a stabilitu výstupu.
elvis
elvis31. 7. 2025
Where to put demonstrations in your prompt? This paper finds that many tasks benefit from demos at the start of the prompt. If demos are placed at the end of the user message, they can flip over 30% of predictions without improving correctness. Great read for AI devs.
140,53K