Головні статті тижня у сфері штучного інтелекту (28 липня – 3 серпня): - ГЕПА - Графік-R1 - АльфаЗемля - Агенти, що саморозвиваються - Ієрархічна модель міркування - Ефективні механізми уваги - Оптимізація політики з середнім геометричним значенням Читайте далі, щоб дізнатися більше:
1. Основи AlphaEarth AlphaEarth Foundations (AEF) представляє модель геопросторового фундаменту, незалежну від завдання, яка вивчає компактне, безперервне в часі поле вбудовування поверхні Землі.
Google DeepMind
Google DeepMind30 лип. 2025 р.
Наша нова модель штучного інтелекту AlphaEarth Foundations наносить на карту планету з дивовижною деталізацією. 🌏🔍 Завдяки нашим новим наборам даних вчені тепер зможуть відстежувати наслідки вирубки лісів, контролювати здоров'я сільськогосподарських культур тощо – значно швидше. 🧵
2. Оптимізація політики з середнім геометричним значенням Представляє стабілізовану альтернативу оптимізації групової відносної політики (GRPO), яка широко використовується для покращення можливостей міркування у великих мовних моделях за допомогою навчання з підкріпленням.
3. ГЕПА Представляє новий оптимізатор, GEPA, який адаптивно покращує підказки для складних систем штучного інтелекту за допомогою відображення природної мови та пошуку на основі Парето.
Lakshya A Agrawal
Lakshya A Agrawal29 лип. 2025 р.
Як оперативна оптимізація порівнюється з RL algos, такими як GRPO? GRPO потребує 1000 розгортань, але люди можуть вчитися на кількох випробуваннях, розмірковуючи про те, що спрацювало, а що ні. Зустрічайте GEPA: оптимізатор рефлексивних підказок, який може перевершити GRPO до 20% завдяки в 35 разів меншій кількості розгортань! 🧵
5. Графік R1 Представляє нову структуру RAG, яка виходить за рамки традиційного одноразового або фрагментованого пошуку, інтегруючи знання зі структурою графа, агентичну багатоходову взаємодію та RL.
elvis
elvis30 лип. 2025 р.
Графік R1 Новий фреймворк RAG щойно випав! Поєднує в собі агентів, GraphRAG і RL. Ось мої нотатки:
7. Де показувати демо в підказці? Вводить зміщення DPP, новий вид позиційної чутливості у великих мовних моделях (LLM), де розташування демонстрацій у підказці значно впливає на точність і стабільність виводу.
elvis
elvis31 лип. 2025 р.
Де розмістити демонстрації у своїй підказці? У цьому документі показано, що багато завдань виграють від демонстрацій на початку командного рядка. Якщо демо-версії розміщені в кінці повідомлення користувача, вони можуть перевернути понад 30% прогнозів без покращення коректності. Чудове чтиво для розробників штучного інтелекту.
140,51K