Los principales artículos de IA de la semana (28 de julio - 3 de agosto): - GEPA - Graph-R1 - AlphaEarth - Agentes Autoevolutivos - Modelo de Razonamiento Jerárquico - Mecanismos de Atención Eficientes - Optimización de Políticas de Media Geométrica Lee más para saber más:
1. Fundaciones AlphaEarth Las Fundaciones AlphaEarth (AEF) presentan un modelo de fundación geoespacial independiente de tareas que aprende un campo de incrustación compacto y continuo en el tiempo de la superficie de la Tierra.
Google DeepMind
Google DeepMind30 jul 2025
Nuestro nuevo modelo de IA AlphaEarth Foundations está mapeando el planeta con un asombroso nivel de detalle. 🌏🔍 Los científicos ahora podrán rastrear el impacto de la deforestación, monitorear la salud de los cultivos y más, de manera significativamente más rápida, gracias a nuestros nuevos conjuntos de datos. 🧵
2. Optimización de Políticas por Media Geométrica Introduce una alternativa estabilizada a la Optimización de Políticas Relativas de Grupo (GRPO), que se utiliza ampliamente para mejorar las capacidades de razonamiento en grandes modelos de lenguaje a través del aprendizaje por refuerzo.
3. GEPA Presenta un nuevo optimizador, GEPA, que mejora de forma adaptativa las indicaciones para sistemas de IA compuestos mediante la reflexión del lenguaje natural y la búsqueda basada en Pareto.
Lakshya A Agrawal
Lakshya A Agrawal29 jul 2025
¿Cómo se compara la optimización rápida con algoritmos de RL como GRPO? GRPO necesita miles de implementaciones, pero los humanos pueden aprender de algunas pruebas, reflexionando sobre lo que funcionó y lo que no. Conozca GEPA: un optimizador de avisos reflexivos que puede superar a GRPO hasta en un 20% con 35 veces menos implementaciones. 🧵
5. Graph-R1 Introduce un nuevo marco RAG que va más allá de la recuperación tradicional de un solo intento o basada en fragmentos, integrando conocimiento estructurado en grafos, interacción multi-turno agente y RL.
elvis
elvis30 jul 2025
Graph-R1 ¡Nuevo marco RAG lanzado! Combina agentes, GraphRAG y RL. Aquí están mis notas:
7. ¿Dónde mostrar demostraciones en tu aviso? Introduce el sesgo DPP, un nuevo tipo de sensibilidad posicional en los modelos de lenguaje grandes (LLMs) donde la ubicación de las demostraciones en un aviso afecta significativamente la precisión y estabilidad de la salida.
elvis
elvis31 jul 2025
¿Dónde poner las demostraciones en tu aviso? Este documento encuentra que muchas tareas se benefician de las demostraciones al inicio del aviso. Si las demostraciones se colocan al final del mensaje del usuario, pueden cambiar más del 30% de las predicciones sin mejorar la corrección. Gran lectura para desarrolladores de IA.
140,52K