Veckans bästa AI-tidningar (28 juli - 3 augusti): - GEPA - Graf-R1 - AlphaEarth (på engelska) - Självutvecklande agenter - Modell för hierarkiskt resonemang - Effektiva uppmärksamhetsmekanismer - Geometrisk-medelvärdesoptimering av policy Läs vidare för mer information:
1. AlphaEarth-stiftelser AlphaEarth Foundations (AEF) introducerar en uppgiftsagnostisk geospatial grundläggningsmodell som lär sig ett kompakt, tidskontinuerligt inbäddningsfält av jordens yta.
Google DeepMind
Google DeepMind30 juli 2025
Vår nya AI-modell AlphaEarth Foundations kartlägger planeten i häpnadsväckande detalj. 🌏🔍 Forskare kommer nu att kunna spåra effekterna av avskogning, övervaka grödornas hälsa och mycket mer – betydligt snabbare tack vare våra nya datamängder. 🧵
2. Geometrisk medelvärdesoptimering av politiken Introducerar ett stabiliserat alternativ till GRPO (Group Relative Policy Optimization), som används i stor utsträckning för att förbättra resonemangsförmågan i stora språkmodeller via förstärkningsinlärning.
3. GEPA Introduces a new optimizer, GEPA, that adaptively improves prompts for compound AI systems using natural language reflection and Pareto-based search.
Lakshya A Agrawal
Lakshya A Agrawal29 juli 2025
Hur står sig snabb optimering jämfört med RL-algoritmer som GRPO? GRPO behöver 1000-tals utrullningar, men människor kan lära sig av några försök – genom att reflektera över vad som fungerade och vad som inte fungerade. Möt GEPA: en reflekterande promptoptimerare som kan överträffa GRPO med upp till 20 % med 35 gånger färre utrullningar! 🧵
5. Graf-R1 Introducerar ett nytt RAG-ramverk som går bortom traditionell one-shot eller chunk-baserad hämtning genom att integrera grafstrukturerad kunskap, agentisk multi-turn-interaktion och RL.
elvis
elvis30 juli 2025
Graf-R1 Det nya RAG-ramverket har precis släppts! Kombinerar agenter, GraphRAG och RL. Här är mina anteckningar:
7. Var kan du visa demos i din prompt? Introducerar DPP-bias, en ny typ av positionskänslighet i stora språkmodeller (LLM) där placeringen av demonstrationer i en prompt avsevärt påverkar utdatanoggrannheten och stabiliteten.
elvis
elvis31 juli 2025
Var ska du lägga demonstrationer i din prompt? I det här dokumentet konstateras att många uppgifter drar nytta av demonstrationer i början av prompten. Om demos placeras i slutet av användarmeddelandet kan de vända på 30 % av förutsägelserna utan att förbättra korrektheten. Bra läsning för AI-utvecklare.
140,54K