Các Bài Báo AI Hàng Đầu Trong Tuần (28 tháng 7 - 3 tháng 8): - GEPA - Graph-R1 - AlphaEarth - Đại lý Tự Phát Triển - Mô Hình Lý Luận Hệ Thống - Cơ Chế Chú Ý Hiệu Quả - Tối Ưu Chính Sách Trung Bình Hình Học Đọc tiếp để biết thêm:
1. AlphaEarth Foundations AlphaEarth Foundations (AEF) giới thiệu một mô hình nền địa lý không phụ thuộc vào nhiệm vụ, học một trường nhúng liên tục theo thời gian và gọn gàng của bề mặt Trái Đất.
Google DeepMind
Google DeepMind30 thg 7, 2025
Mô hình AI mới của chúng tôi, AlphaEarth Foundations, đang lập bản đồ hành tinh với độ chi tiết đáng kinh ngạc. 🌏🔍 Các nhà khoa học giờ đây sẽ có thể theo dõi tác động của nạn phá rừng, giám sát sức khỏe cây trồng và nhiều hơn nữa – nhanh chóng hơn đáng kể, nhờ vào các bộ dữ liệu mới của chúng tôi. 🧵
2. Tối ưu hóa chính sách trung bình hình học Giới thiệu một phương pháp thay thế ổn định cho Tối ưu hóa chính sách tương đối nhóm (GRPO), được sử dụng rộng rãi để cải thiện khả năng suy luận trong các mô hình ngôn ngữ lớn thông qua học tăng cường.
3. GEPA Giới thiệu một trình tối ưu hóa mới, GEPA, cải thiện lời nhắc thích ứng cho các hệ thống AI phức hợp bằng cách sử dụng phản xạ ngôn ngữ tự nhiên và tìm kiếm dựa trên Pareto.
Lakshya A Agrawal
Lakshya A Agrawal29 thg 7, 2025
How does prompt optimization compare to RL algos like GRPO? GRPO needs 1000s of rollouts, but humans can learn from a few trials—by reflecting on what worked & what didn't. Meet GEPA: a reflective prompt optimizer that can outperform GRPO by up to 20% with 35x fewer rollouts!🧵
5. Graph-R1 Giới thiệu một khung RAG mới vượt ra ngoài việc truy xuất một lần hoặc theo từng khối truyền thống bằng cách tích hợp kiến thức có cấu trúc đồ thị, tương tác đa lượt có tính tác động và RL.
elvis
elvis30 thg 7, 2025
Graph-R1 Khung RAG mới vừa ra mắt! Kết hợp các tác nhân, GraphRAG và RL. Dưới đây là ghi chú của tôi:
7. Nơi nào để hiển thị các bản demo trong lời nhắc của bạn? Giới thiệu DPP bias, một loại độ nhạy vị trí mới trong các mô hình ngôn ngữ lớn (LLMs) mà vị trí của các bản demo trong một lời nhắc ảnh hưởng đáng kể đến độ chính xác và sự ổn định của đầu ra.
elvis
elvis31 thg 7, 2025
Where to put demonstrations in your prompt? This paper finds that many tasks benefit from demos at the start of the prompt. If demos are placed at the end of the user message, they can flip over 30% of predictions without improving correctness. Great read for AI devs.
140,53K