Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Connor Davis
🔥 Tôi không thể tin điều này tồn tại... cuối cùng ai đó cũng đã viết ra cuốn sách bí mật mà mọi công ty khởi nghiệp AI đều đã giả vờ.
Một nhóm nghiên cứu vừa công bố "Hướng Dẫn Thực Hành về Thiết Kế, Phát Triển và Triển Khai Quy Trình AI Tác Nhân Chất Lượng Sản Xuất" và nó cơ bản là cuốn sổ tay nội bộ mà mọi người *nghĩ* rằng OpenAI và Anthropic đang sử dụng.
Không phải là sự phấn khích.
Không phải là các sơ đồ với những mũi tên dễ thương.
Một bản thiết kế kỹ thuật thực sự cho các tác nhân không sụp đổ ngay khi bạn rời khỏi hộp cát trình diễn.
Đây là những gì làm cho nó điên rồ 👇
1 / Họ bắt đầu bằng cách chỉ ra lý do tại sao hầu hết các tác nhân lại sụp đổ
Không bao giờ là mô hình.
Đó là hệ thống xung quanh nó:
• định tuyến công cụ không xác định
• lỗi MCP âm thầm
• các tác nhân tự phát thực hiện thứ tự
• quy trình làm việc tạo ra kết quả khác nhau mỗi lần chạy
Họ cho thấy các dấu vết thất bại thô — nhật ký thực tế của các tác nhân bị sai, lặp lại hoặc ảo tưởng công cụ.
Nó đọc như một cuộc khám nghiệm tử thi của mọi buổi trình diễn "nhân viên AI tự động".
2 / Họ xây dựng lại toàn bộ hệ thống xung quanh tính xác định
Mỗi cuộc gọi công cụ trở thành một hàm có kiểu.
Mỗi đường đi thực hiện có thể phát lại.
Mỗi bước là xác định.
Nếu hệ thống không thể sản xuất cùng một đầu ra hai lần, nó không phải là chất lượng sản xuất.
Quy tắc này một mình giết chết một nửa sự hỗn loạn mà mọi người nhầm lẫn với "sự xuất hiện".
3 / Họ thực thi các tác nhân có trách nhiệm đơn lẻ
Không có mega-tác nhân với 12 nhân cách.
Thay vào đó:
• lập kế hoạch
• tác nhân lý luận
• thực thi công cụ
• xác thực
• tổng hợp
Mỗi cái có ranh giới nghiêm ngặt.
Không có công cụ ảo tưởng.
Không có lý luận đa nhiệm.
Không có tự do.
Đây là kỹ thuật backend, không phải vai trò.
4 / Họ ngoại hóa mọi lời nhắc như cấu hình thực
Lời nhắc không còn là chuỗi ẩn nữa — chúng là:
• được kiểm soát phiên bản
• có thể kiểm tra
• có thể so sánh
• có thể tải lại
Điều này tạo ra hành vi ổn định và ngăn chặn các sự suy giảm vô hình.
5 / Họ điều hành một liên minh mô hình với một trọng tài
GPT + Claude + Gemini không thể thay thế cho nhau.
Chúng là những cộng tác viên.
Mỗi cái sản xuất một bản nháp.
Một tác nhân lý luận hợp nhất chúng, giải quyết mâu thuẫn và xuất ra một kết quả thống nhất.
Tranh luận có cấu trúc, không phải là trò chơi mô hình.
6 / Họ tách rời động cơ quy trình làm việc khỏi lớp MCP
Họ tách rời:
• điều phối
• truy cập công cụ
• thử lại
• kiểm tra sức khỏe
• mở rộng
• quan sát
Kết quả: một hệ thống tác nhân hoạt động như các dịch vụ vi mô, không phải là một macro trò chuyện dán băng.
7 / Sau đó họ chứng minh mọi thứ với một quy trình sản xuất thực sự
Một hệ thống tin tức đầy đủ ➝ phân tích ➝ kịch bản ➝ lý luận ➝ âm thanh ➝ video ➝ hệ thống PR GitHub.
Sơ đồ hoàn chỉnh.
Dấu vết hoàn chỉnh.
Thất bại thực tế.
Sửa chữa thực tế.
Đây là điều gần nhất mà lĩnh vực này có được với một kiến trúc chuẩn cho các tác nhân có thể chịu tải thực tế.
Nếu ngăn xếp tác nhân của bạn không có:
• quy trình làm việc xác định
• trách nhiệm tách biệt
• lời nhắc ngoại hóa
• trọng tài đa mô hình
• cơ sở hạ tầng thích hợp
• quan sát đầy đủ
…bạn không đang xây dựng các tác nhân.
Bạn đang xây dựng các buổi trình diễn.
Hướng dẫn này là bản thiết kế thực sự đầu tiên cho các hệ thống AI sản xuất và nó nâng cao tiêu chuẩn cho mọi người.

12K
Chúa ơi… tài liệu này có thể là sự chuyển mình quan trọng nhất trong cách chúng ta sử dụng LLMs trong suốt năm nay.
"Mô hình nguyên nhân lớn từ các mô hình ngôn ngữ lớn."
Nó cho thấy bạn có thể phát triển các mô hình nguyên nhân đầy đủ trực tiếp từ một LLM, không phải là các xấp xỉ, không phải là cảm giác, mà là các đồ thị nguyên nhân thực sự, các phản thực, các can thiệp và các cấu trúc đã được kiểm tra ràng buộc.
Và cách họ làm điều đó thật điên rồ:
Thay vì đào tạo một mô hình nguyên nhân chuyên biệt, họ thẩm vấn LLM như một nhà khoa học:
→ trích xuất một đồ thị nguyên nhân ứng cử từ văn bản
→ yêu cầu mô hình kiểm tra các độc lập điều kiện
→ phát hiện mâu thuẫn
→ sửa đổi cấu trúc
→ kiểm tra các phản thực và dự đoán can thiệp
→ lặp lại cho đến khi mô hình nguyên nhân ổn định
Kết quả là một thứ mà chúng ta chưa bao giờ có trước đây:
một hệ thống nguyên nhân được xây dựng bên trong LLM sử dụng kiến thức thế giới tiềm ẩn của chính nó.
Trên các tiêu chuẩn tổng hợp, thế giới thực, các lĩnh vực lộn xộn, những LCM này vượt trội hơn các phương pháp phát hiện nguyên nhân cổ điển vì chúng rút ra từ kiến thức trước đó khổng lồ của LLM thay vì chỉ là các tương quan cục bộ.
Và lý luận phản thực?
Thật đáng kinh ngạc.
Mô hình có thể trả lời các câu hỏi "nếu thì" mà các thuật toán tiêu chuẩn hoàn toàn thất bại, chỉ đơn giản vì nó đã "biết" những điều về thế giới mà các thuật toán đó không thể suy luận từ dữ liệu một mình.
Tài liệu này gợi ý về một tương lai mà LLMs không chỉ là những cỗ máy mẫu.
Chúng trở thành các động cơ nguyên nhân, các hệ thống hình thành, kiểm tra và tinh chỉnh các giải thích cấu trúc về thực tại.
Nếu điều này mở rộng, mọi lĩnh vực dựa vào suy diễn nguyên nhân như kinh tế, y tế, chính sách, khoa học sắp được viết lại.
LLMs sẽ không chỉ cho bạn biết điều gì xảy ra.
Chúng sẽ cho bạn biết tại sao.

41,99K
Không ai sẵn sàng cho những gì tài liệu Stanford này tiết lộ về AI đa tác nhân.
"Hợp tác tiềm ẩn trong các hệ thống đa tác nhân" cho thấy rằng các tác nhân không cần tin nhắn, giao thức hay hướng dẫn làm việc nhóm rõ ràng. Họ bắt đầu phối hợp bên trong các đại diện ẩn của chính họ một lớp hợp tác hoàn chỉnh chỉ tồn tại trong không gian tiềm ẩn.
Và những hành vi thì điên rồ:
• Các tác nhân lặng lẽ chuyển giao nhiệm vụ dựa trên ai là người giỏi hơn
• Các vai trò xuất hiện từ hư không: lãnh đạo, thực hiện, hỗ trợ
• Các chính sách mã hóa tín hiệu mà không bao giờ xuất hiện trong hành động
• Các đội nhóm thích nghi với môi trường mới mà không cần đào tạo lại
• Sự hợp tác vẫn ổn định ngay cả khi giao tiếp là không thể
Chi tiết điên rồ nhất:
Ngay cả khi bạn loại bỏ tất cả các kênh giao tiếp, các tác nhân vẫn hợp tác. "Làm việc nhóm" không sống trong các tin nhắn. Nó sống trong mạng lưới.
Điều này đảo ngược toàn bộ sách hướng dẫn đa tác nhân.
Chúng ta đã xây dựng các cơ chế phối hợp trên…
trong khi sự phối hợp thực sự đang diễn ra bên dưới.
Một kỷ nguyên mới của trí thông minh đội nhóm nổi lên — và nó đang diễn ra ở những nơi mà chúng ta thậm chí không nhìn tới.
Dự án: github. com/Gen-Verse/LatentMAS

138,39K
Hàng đầu
Thứ hạng
Yêu thích
