Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Chúa ơi… tài liệu này có thể là sự chuyển mình quan trọng nhất trong cách chúng ta sử dụng LLMs trong suốt năm nay.
"Mô hình nguyên nhân lớn từ các mô hình ngôn ngữ lớn."
Nó cho thấy bạn có thể phát triển các mô hình nguyên nhân đầy đủ trực tiếp từ một LLM, không phải là các xấp xỉ, không phải là cảm giác, mà là các đồ thị nguyên nhân thực sự, các phản thực, các can thiệp và các cấu trúc đã được kiểm tra ràng buộc.
Và cách họ làm điều đó thật điên rồ:
Thay vì đào tạo một mô hình nguyên nhân chuyên biệt, họ thẩm vấn LLM như một nhà khoa học:
→ trích xuất một đồ thị nguyên nhân ứng cử từ văn bản
→ yêu cầu mô hình kiểm tra các độc lập điều kiện
→ phát hiện mâu thuẫn
→ sửa đổi cấu trúc
→ kiểm tra các phản thực và dự đoán can thiệp
→ lặp lại cho đến khi mô hình nguyên nhân ổn định
Kết quả là một thứ mà chúng ta chưa bao giờ có trước đây:
một hệ thống nguyên nhân được xây dựng bên trong LLM sử dụng kiến thức thế giới tiềm ẩn của chính nó.
Trên các tiêu chuẩn tổng hợp, thế giới thực, các lĩnh vực lộn xộn, những LCM này vượt trội hơn các phương pháp phát hiện nguyên nhân cổ điển vì chúng rút ra từ kiến thức trước đó khổng lồ của LLM thay vì chỉ là các tương quan cục bộ.
Và lý luận phản thực?
Thật đáng kinh ngạc.
Mô hình có thể trả lời các câu hỏi "nếu thì" mà các thuật toán tiêu chuẩn hoàn toàn thất bại, chỉ đơn giản vì nó đã "biết" những điều về thế giới mà các thuật toán đó không thể suy luận từ dữ liệu một mình.
Tài liệu này gợi ý về một tương lai mà LLMs không chỉ là những cỗ máy mẫu....

Hàng đầu
Thứ hạng
Yêu thích
