Cửa hàng DApp | Trung tâm Web3 với các sự kiện và trò chơi | Ví Web3 OKX

Tôi có thể làm gì với Khám phá

background background

discoveryBanners

Chủ đề thịnh hành

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN-3,82%

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Anshuman (e/ia)

Anshuman (e/ia)

Anshuman (e/ia)21:18 20 thg 9

Bạn đang trong một cuộc phỏng vấn Kỹ sư ML tại Perplexity, và người phỏng vấn hỏi: "Mô hình LLM của bạn tạo ra hàng triệu phản hồi mỗi ngày. Làm thế nào bạn đánh giá chất lượng mà không cần xem xét thủ công?" Đây là cách bạn trả lời:

164,04K

Anshuman (e/ia)

Anshuman (e/ia)11:50 19 thg 9

Trong tuần qua, tôi đã nghiên cứu sâu về các môi trường RL. Một blog sẽ sớm ra mắt. Tôi có thể nói rằng, các đánh giá là đủ tốt cho LLMs, nhưng đối với các tác nhân, chúng ta cần những môi trường mà nó có thể học với phản hồi. Blog này sẽ chủ yếu nói về việc viết các môi trường với các bộ xác minh. @willccbb và @PrimeIntellect đã thực hiện một số công việc rất có ảnh hưởng!

26,3K

Hàng đầu

Thứ hạng

Yêu thích

©2017 - 2025 WEB3.OKX.COM

Tiếng Việt 简体中文繁體中文 English Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Română Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska

Tìm hiểu thêm về OKX Web3

Tải xuống Học viện Về OKX Cơ hội nghề nghiệp Liên hệ với chúng tôi Điều khoản dịch vụ Thông báo Bảo mật X (trước đây là Twitter)

Sản phẩm

Trang thông tin ví Hoán đổi Thị trường Earn Khám phá Xây dựng Trình khám phá Bảo mật

Hỗ trợ

Trung tâm hỗ trợ Xác minh chính thức Thông báo Biểu phí DEX Kết nối với OKX Ví Bitcoin Ví Ethereum Ví Solana