Головні статті тижня у сфері штучного інтелекту (28 липня – 3 серпня): - ГЕПА - Графік-R1 - АльфаЗемля - Агенти, що саморозвиваються - Ієрархічна модель міркування - Ефективні механізми уваги - Оптимізація політики з середнім геометричним значенням Читайте далі, щоб дізнатися більше:
1. Основи AlphaEarth AlphaEarth Foundations (AEF) представляє модель геопросторового фундаменту, незалежну від завдання, яка вивчає компактне, безперервне в часі поле вбудовування поверхні Землі.
Google DeepMind
Google DeepMind30 лип. 2025 р.
Our new AI model AlphaEarth Foundations is mapping the planet in astonishing detail. 🌏🔍 Scientists will now be able to track the impact of deforestation, monitoring crop health, and more – significantly faster, thanks to our new datasets. 🧵
2. Оптимізація політики з середнім геометричним значенням Представляє стабілізовану альтернативу оптимізації групової відносної політики (GRPO), яка широко використовується для покращення можливостей міркування у великих мовних моделях за допомогою навчання з підкріпленням.
3. ГЕПА Представляє новий оптимізатор, GEPA, який адаптивно покращує підказки для складних систем штучного інтелекту за допомогою відображення природної мови та пошуку на основі Парето.
Lakshya A Agrawal
Lakshya A Agrawal29 лип. 2025 р.
Як оперативна оптимізація порівнюється з RL algos, такими як GRPO? GRPO потребує 1000 розгортань, але люди можуть вчитися на кількох випробуваннях, розмірковуючи про те, що спрацювало, а що ні. Зустрічайте GEPA: оптимізатор рефлексивних підказок, який може перевершити GRPO до 20% завдяки в 35 разів меншій кількості розгортань! 🧵
5. Графік R1 Представляє нову структуру RAG, яка виходить за рамки традиційного одноразового або фрагментованого пошуку, інтегруючи знання зі структурою графа, агентичну багатоходову взаємодію та RL.
elvis
elvis30 лип. 2025 р.
Графік R1 Новий фреймворк RAG щойно випав! Поєднує в собі агентів, GraphRAG і RL. Ось мої нотатки:
7. Де показувати демо в підказці? Вводить зміщення DPP, новий вид позиційної чутливості у великих мовних моделях (LLM), де розташування демонстрацій у підказці значно впливає на точність і стабільність виводу.
elvis
elvis31 лип. 2025 р.
Де розмістити демонстрації у своїй підказці? У цьому документі показано, що багато завдань виграють від демонстрацій на початку командного рядка. Якщо демо-версії розміщені в кінці повідомлення користувача, вони можуть перевернути понад 30% прогнозів без покращення коректності. Чудове чтиво для розробників штучного інтелекту.
140,51K